9 czerwca Google oficjalnie zaprezentował Gemini 3.5 Live Translate, nowy model audio, który ma sprawić, że wielojęzyczne rozmowy w czasie rzeczywistym będą brzmiały bardziej naturalnie. W przeciwieństwie do tradycyjnych systemów tłumaczeniowych, które przetwarzają mowę krok po kroku, Gemini 3.5 Live Translate nieustannie słucha, tłumaczy i wymawia, zapewniając płynną rozmowę z zaledwie kilkusekundowym opóźnieniem, imitując naturalne wzorce mowy.
Model ten automatycznie rozpoznaje język mówiony i obsługuje ponad 70 języków, w tym wietnamski, umożliwiając tysiącom par językowych interakcję w ramach tej samej rozmowy. Google twierdzi, że technologia jest już dostępna dla programistów i partnerów, którzy mogą ją zintegrować ze spotkaniami, platformami komunikacyjnymi i aplikacjami mobilnymi.
Największa zmiana dotyczy sposobu tłumaczenia. Zamiast czekać, aż ktoś skończy mówić, zanim wygeneruje odpowiedź, model wykonuje tłumaczenie w sposób ciągły. Rezultatem jest płynniejsza komunikacja, minimalizująca przerwy, przerw i opóźnień.
Funkcja Live Translate w Gemini 3.5 jest również globalnie udostępniana w aplikacji Google Tłumacz na Androida i iOS. Aby z niej skorzystać, wystarczy podłączyć słuchawki.
Użytkownicy systemu Android mogą teraz korzystać z nowego trybu słuchania zintegrowanego z funkcją 3.5 Live Translate, który umożliwi im słuchanie tłumaczeń bezpośrednio przez głośnik telefonu.
Użytkownicy po prostu trzymają telefon przy uchu, tak jak podczas standardowej rozmowy, a przetłumaczony dźwięk jest przesyłany bezpośrednio do słuchacza. To nowe rozwiązanie jest szczególnie przydatne w sytuacjach, gdy trzeba szybko odsłuchać tłumaczenie, niezauważonym przez innych, a słuchawki nie są dostępne.
Model ten opiera się na codziennych kontekstach komunikacyjnych. Według Google, narzędzie może działać w hałaśliwym otoczeniu i zostało zaprojektowane tak, aby radzić sobie z hałasem tła, nakładającymi się głosami i swobodnym stylem mówienia typowym dla życia codziennego. Ta funkcja sprawia, że aplikacja nadaje się do szerokiego zakresu zastosowań w praktyce, w tym do obsługi klienta, wycieczek z przewodnikiem, sal lekcyjnych, usług przewozowych i transmisji na żywo.
Według Google, Grab testuje model, który ma pomóc kierowcom i pasażerom komunikować się w wielu językach w czasie niemal rzeczywistym w punktach odbioru. Użytkownicy ci wykonują obecnie ponad 10 milionów połączeń głosowych miesięcznie za pośrednictwem Graba.
Google kładzie również duży nacisk na jakość głosu. Zamiast tworzyć ogólny, syntetyczny głos, system stara się zachować elementy wypowiedzi oryginalnego mówcy, w tym rytm, intonację i ton emocjonalny. Efektem jest bardziej naturalne i łatwiejsze do zrozumienia tłumaczenie audio.
Nadrzędnym celem Google jest przeniesienie tłumaczenia na żywo poza konwencjonalne prezentacje i wprowadzenie go do codziennej komunikacji. Umożliwiając prowadzenie wielojęzycznych rozmów niemal w czasie rzeczywistym bez konieczności zmiany sposobu mówienia, Gemini 3.5 Live Translate może sprawić, że interakcje transgraniczne staną się bardziej praktyczne zarówno dla firm, organizacji, jak i osób prywatnych.
(Według Cnet i Google)

Powód, dla którego Google zwróciło się o pozwolenie na wypuszczenie 32 milionów sterylnych samców komarów w USA: Google właśnie zwróciło się do rządu USA o pozwolenie na wypuszczenie 32 milionów sterylnych samców komarów w Kalifornii i na Florydzie w celu wyeliminowania komarów przenoszących choroby za pomocą swojego projektu technologicznego Debug.
Źródło: https://vietnamnet.vn/gemini-3-5-live-translate-dich-thoi-gian-thuc-khong-do-tre-2524461.html