در تاریخ ۹ ژوئن، گوگل رسماً Gemini 3.5 Live Translate را معرفی کرد، یک مدل صوتی جدید که برای طبیعیتر کردن مکالمات چندزبانه در لحظه طراحی شده است. برخلاف سیستمهای ترجمه سنتی که گفتار را به صورت نوبتی پردازش میکنند، Gemini 3.5 Live Translate به طور مداوم گوش میدهد، ترجمه میکند و تلفظ میکند و در نتیجه مکالمهای روان با تنها چند ثانیه تأخیر برای تقلید الگوهای گفتار طبیعی ایجاد میکند.
این مدل به طور خودکار زبان گفتاری را تشخیص میدهد و از بیش از ۷۰ زبان، از جمله ویتنامی، پشتیبانی میکند و به هزاران جفت زبانی اجازه میدهد تا در یک مکالمه با هم تعامل داشته باشند. گوگل میگوید این فناوری اکنون در دسترس توسعهدهندگان و شرکا است که میتوانند آن را در جلسات، پلتفرمهای ارتباطی و برنامههای تلفن همراه ادغام کنند.
بزرگترین تغییر در نحوه انجام ترجمه نهفته است. به جای اینکه منتظر بمانیم تا کسی صحبت خود را تمام کند و سپس پاسخی ارائه دهیم، این مدل ترجمه را در یک جریان مداوم انجام میدهد. نتیجه، یک تجربه ارتباطی روانتر است که مکثها، وقفهها و تأخیرها را به حداقل میرساند.
Gemini 3.5 Live Translate همچنین به صورت جهانی در برنامه Google Translate برای اندروید و iOS عرضه میشود. هنگام استفاده از ویژگی Live Translate، کاربران فقط باید هدفون خود را به آن متصل کنند تا آن را تجربه کنند.
برای کاربران اندروید، این پلتفرم شروع به ارائه یک حالت شنیداری جدید کرده است که با نسخه ۳.۵ Live Translate یکپارچه شده است و به کاربران امکان میدهد ترجمهها را مستقیماً از طریق بلندگوی تلفن خود گوش دهند.
کاربران به سادگی گوشی را درست مانند یک تماس معمولی، نزدیک گوش خود نگه میدارند و صدای ترجمه شده مستقیماً به شنونده منتقل میشود. این تجربه جدید به ویژه در موقعیتهایی مفید است که نیاز دارید ترجمه را به سرعت و بدون توجه دیگران بشنوید و هدفون در دسترس نیست.
این مدل بر اساس زمینههای ارتباطی روزمره ساخته شده است. طبق گفته گوگل، این ابزار میتواند در محیطهای پر سر و صدا کار کند و به گونهای طراحی شده است که نویز پسزمینه، صداهای همپوشانی و سبکهای گفتاری آرام زندگی واقعی را مدیریت کند. این ویژگی، این برنامه را برای طیف گستردهای از موارد استفاده در دنیای واقعی، از جمله تماسهای پشتیبانی مشتری، تورهای هدایتشده، کلاسهای درس، سرویسهای اشتراک خودرو و پخش زنده، مناسب میسازد.
طبق گفته گوگل، گرب در حال آزمایش مدلی است که به رانندگان و مسافران کمک میکند تا در نقاط تحویل بار، به چندین زبان و تقریباً به صورت آنی با یکدیگر ارتباط برقرار کنند. این کاربران در حال حاضر بیش از 10 میلیون تماس صوتی در ماه از طریق گرب برقرار میکنند.
گوگل همچنین تأکید زیادی بر کیفیت صدا دارد. این سیستم به جای ایجاد یک صدای عمومی و ترکیبی، تلاش میکند تا عناصری از صدای گوینده اصلی، از جمله ریتم، آهنگ صدا و لحن احساسی را حفظ کند. این امر منجر به صدای طبیعیتر و قابل فهمتر ترجمه شده میشود.
هدف بزرگتر گوگل این است که ترجمه زنده را فراتر از ارائههای مرسوم و به ارتباطات روزمره ببرد. با فعال کردن مکالمات چندزبانه تقریباً بلادرنگ بدون مجبور کردن کاربران به تغییر عادات گفتاری خود، Gemini 3.5 Live Translate میتواند تعاملات فرامرزی را برای مشاغل، سازمانها و افراد به طور یکسان عملیتر کند.
(طبق گزارشهای Cnet و گوگل)

دلیل گوگل برای درخواست مجوز رهاسازی ۳۲ میلیون پشه نر عقیم در آمریکا: گوگل به تازگی از دولت آمریکا درخواست مجوز کرده است تا از طریق پروژه فناوری Debug خود، ۳۲ میلیون پشه نر عقیم را در کالیفرنیا و فلوریدا رها کند تا پشههای ناقل بیماری را ریشهکن کند.
منبع: https://vietnamnet.vn/gemini-3-5-live-translate-dich-thoi-gian-thuc-khong-do-tre-2524461.html