Am 9. Juni stellte Google offiziell Gemini 3.5 Live Translate vor, ein neues Audiomodell, das mehrsprachige Echtzeitgespräche natürlicher klingen lassen soll. Im Gegensatz zu herkömmlichen Übersetzungssystemen, die gesprochene Sprache wortweise verarbeiten, hört Gemini 3.5 Live Translate kontinuierlich zu, übersetzt und spricht aus. Das Ergebnis ist ein flüssiges Gespräch mit nur wenigen Sekunden Verzögerung, um natürliche Sprachmuster nachzuahmen.
Dieses Modell erkennt automatisch die gesprochene Sprache und unterstützt über 70 Sprachen, darunter Vietnamesisch. Dadurch können Tausende von Sprachpaaren in ein und demselben Gespräch interagieren. Laut Google steht die Technologie nun Entwicklern und Partnern zur Verfügung, die sie in Meetings, Kommunikationsplattformen und mobile Anwendungen integrieren können.
Die größte Veränderung liegt in der Art und Weise, wie die Übersetzung erfolgt. Anstatt darauf zu warten, dass jemand mit dem Sprechen fertig ist, bevor eine Antwort generiert wird, übersetzt das Modell kontinuierlich. Das Ergebnis ist eine flüssigere Kommunikation mit weniger Pausen, Unterbrechungen und Verzögerungen.
Gemini 3.5 Live Translate wird weltweit auch in der Google Translate App für Android und iOS eingeführt. Um die Live-Übersetzungsfunktion zu nutzen, müssen Nutzer lediglich Kopfhörer anschließen.
Für Android-Nutzer wird ab sofort ein neuer Hörmodus eingeführt, der in 3.5 Live Translate integriert ist und es den Nutzern ermöglicht, Übersetzungen direkt über den Lautsprecher ihres Telefons anzuhören.
Nutzer halten das Telefon einfach ans Ohr, wie bei einem normalen Anruf, und die Übersetzung wird direkt an den Zuhörer übertragen. Diese neue Funktion ist besonders praktisch, wenn man schnell und unauffällig eine Übersetzung hören muss und keine Kopfhörer zur Hand sind.
Das Modell basiert auf alltäglichen Kommunikationssituationen. Laut Google funktioniert das Tool auch in lauten Umgebungen und ist darauf ausgelegt, Hintergrundgeräusche, überlappende Stimmen und den entspannten Sprechstil im Alltag zu bewältigen. Dadurch eignet sich die Anwendung für eine Vielzahl praktischer Anwendungsfälle, darunter Kundensupport-Anrufe, geführte Touren , Unterricht, Fahrdienste und Live-Streaming.
Laut Google testet Grab ein Modell, das Fahrern und Fahrgästen die Kommunikation in mehreren Sprachen nahezu in Echtzeit an Abholpunkten ermöglichen soll. Diese Nutzer tätigen derzeit monatlich über 10 Millionen Sprachanrufe über Grab.
Google legt zudem großen Wert auf die Sprachqualität. Anstatt eine generische, synthetische Stimme zu erzeugen, ist das System bestrebt, Elemente der Sprechweise des ursprünglichen Sprechers zu bewahren, darunter Rhythmus, Intonation und emotionale Nuancen. Dies führt zu natürlicher klingenden und leichter verständlichen Übersetzungen.
Googles übergeordnetes Ziel ist es, Live-Übersetzung über herkömmliche Präsentationen hinaus in die alltägliche Kommunikation zu integrieren. Durch die Ermöglichung mehrsprachiger Konversationen in nahezu Echtzeit, ohne dass Nutzer ihre Sprechgewohnheiten ändern müssen, kann Gemini 3.5 Live Translate grenzüberschreitende Interaktionen für Unternehmen, Organisationen und Privatpersonen gleichermaßen vereinfachen.
(Laut CNET und Google)

Begründung von Google für den Antrag auf Genehmigung zur Freisetzung von 32 Millionen sterilen männlichen Mücken in den USA: Google hat soeben bei der US- Regierung die Genehmigung beantragt, 32 Millionen sterile männliche Mücken in Kalifornien und Florida freizusetzen, um im Rahmen seines Debug-Technologieprojekts krankheitsübertragende Mücken auszurotten.
Quelle: https://vietnamnet.vn/gemini-3-5-live-translate-dich-thoi-gian-thuc-khong-do-tre-2524461.html