Den 9. juni introducerede Google officielt Gemini 3.5 Live Translate, en ny lydmodel designet til at få flersprogede samtaler i realtid til at lyde mere naturlige. I modsætning til traditionelle oversættelsessystemer, der behandler tale trin for trin, lytter, oversætter og udtaler Gemini 3.5 Live Translate kontinuerligt, hvilket resulterer i en jævn samtale med kun få sekunders forsinkelse for at efterligne naturlige talemønstre.
Denne model genkender automatisk det talte sprog og understøtter over 70 sprog, inklusive vietnamesisk, hvilket giver tusindvis af sprogpar mulighed for at interagere i den samme samtale. Google siger, at teknologien nu er tilgængelig for udviklere og partnere, som kan integrere den i møder, kommunikationsplatforme og mobilapplikationer.
Den største ændring ligger i, hvordan oversættelsen finder sted. I stedet for at vente på, at nogen er færdig med at tale, før der genereres et svar, udfører modellen oversættelsen i en kontinuerlig strøm. Resultatet er en mere jævn kommunikationsoplevelse, der minimerer pauser, afbrydelser og forsinkelser.
Gemini 3.5 Live Translate bliver også rullet globalt ud på Google Translate-appen til både Android og iOS. Når man bruger Live Translate-funktionen, skal man blot tilslutte hovedtelefoner for at opleve den.
For Android-brugere begynder platformen at udrulle en ny lyttetilstand integreret med 3.5 Live Translate, der giver brugerne mulighed for at lytte til oversættelser direkte via deres telefons højttaler.
Brugere holder blot telefonen op til øret, ligesom under et almindeligt opkald, og den oversatte lyd sendes direkte til lytteren. Denne nye oplevelse er især nyttig i situationer, hvor du hurtigt har brug for at høre en oversættelse uden at andre bemærker det, og hvor hovedtelefoner ikke er tilgængelige.
Modellen er bygget op omkring hverdagens kommunikationskontekster. Ifølge Google kan værktøjet fungere i støjende miljøer og er designet til at håndtere baggrundsstøj, overlappende stemmer og den afslappede talestil i det virkelige liv. Denne funktion gør applikationen velegnet til en bred vifte af brugsscenarier i den virkelige verden, herunder kundesupportopkald, guidede ture , klasseværelser, samkørselstjenester og livestreaming.
Ifølge Google tester Grab en model, der skal hjælpe chauffører og passagerer med at kommunikere på flere sprog i næsten realtid ved afhentningssteder. Disse brugere foretager i øjeblikket mere end 10 millioner taleopkald om måneden via Grab.
Google lægger også stor vægt på stemmekvalitet. I stedet for at skabe en generisk, syntetiseret stemme, stræber systemet efter at bevare elementer fra den oprindelige talerens fremførelse, herunder rytme, intonation og følelsesmæssig tone. Dette resulterer i en mere naturlig og lettere oversat lyd at følge.
Googles overordnede mål er at bringe liveoversættelse ud over konventionelle præsentationer og ind i den daglige kommunikation. Ved at muliggøre flersprogede samtaler i næsten realtid uden at tvinge brugerne til at ændre deres talevaner, kan Gemini 3.5 Live Translate gøre grænseoverskridende interaktioner mere praktiske for både virksomheder, organisationer og enkeltpersoner.
(Ifølge Cnet og Google)

Googles begrundelse for at anmode om tilladelse til at sætte 32 millioner sterile hanmyg ud i USA: Google har netop anmodet om tilladelse fra den amerikanske regering til at sætte 32 millioner sterile hanmyg ud i Californien og Florida for at udrydde sygdomsbærende myg gennem sit Debug-teknologiprojekt.
Kilde: https://vietnamnet.vn/gemini-3-5-live-translate-dich-thoi-gian-thuc-khong-do-tre-2524461.html