Vietnam.vn - Nền tảng quảng bá Việt Nam

Det stora problemet med Veo 3

Denna AI-modell lägger automatiskt in röriga, meningslösa undertexter i videor mer än en månad efter lanseringen. Denna situation visar att Google är villigt att släppa ofärdiga produkter för att demonstrera sina AI-funktioner.

ZNewsZNews19/07/2025

Veo3 är Googles senaste AI-modell, som lanserades i slutet av maj, och som låter användare skapa videor baserade på röstkommandon. Modellen har uppmärksammats av innehållsskapare eftersom den möjliggör skapandet av videor med ljud och dialog, en funktion som inte fanns i tidigare versioner av Googles modell, vilket gör dem mer realistiska.

Många användare använder Veo 3-videoklipp, upp till 8 sekunder långa, för att skapa reklamfilmer, ASMR-videor, fantasy-filmtrailers och humoristiska gatuintervjuer.

Den Oscarsnominerade regissören Darren Aronofsky använde verktyget för att skapa en kortfilm med titeln Ancestra. På presskonferensen jämförde Google DeepMinds VD Demis Hassabis Veo 3 med ett steg "ut ur stumfilmseran" inom filmvärlden.

"Persistent"-undertexter från Veo 3

Många användare har dock upptäckt att det här verktyget inte fungerar som förväntat. När man skapar klipp med dialog infogar Veo 3 ofta automatiskt meningslösa, röriga undertexter, även när kommandot tydligt anger att man inte ska lägga till undertexter.

Att ta bort dessa undertexter är inte enkelt. Användare tvingas återskapa klippet, spendera "tokens" vilket innebär att spendera mer pengar på Google, eller använda externa verktyg för att ta bort undertexterna, eller trimma videon för att ta bort undertexterna.

video AI anh 1

Veo 3 producerar realistiska bilder och dialoger som matchar läpprörelser, men undertexterna är meningslösa. Foto: Lesswrong .

Josh Woodward, vice vd för Google Labs och Gemini, publicerade på X den 9 juni att Google hade utvecklat patchar för att minska spamproblemet. Men mer än en månad senare fortsätter användare att rapportera problemet på Google Labs Discord-kanal, vilket visar att det inte är lätt att åtgärda buggar i stora AI-modeller.

Precis som Googles tidigare modeller för AI-videoskapande är Veo 3 en betalmodell, med priser från 249,99 dollar per månad. För att skapa en 8-sekunders video anger användare en beskrivning i Flow, Gemini eller någon annan plattform. Varje klippskapande med Veo 3 kostar minst 20 AI-krediter, och användare kan fylla på med 25 dollar för 2 500 krediter.

Mona Weiss, en kommersiell regissör, ​​säger att det blir en betydande kostnad att återskapa filmmaterial för att ta bort undertexter. ”Om du skapar en scen med dialog med Veo3 kommer ungefär 40 % av resultatet att ha meningslösa undertexter som gör videon oanvändbar”, säger hon. ”Det kostar mycket pengar att få en scen du gillar, men det slutar med att den blir oanvändbar.”

Du kanske också gillar
VM 2026 ökar sökningar relaterade till sökordet "fotboll".
VM 2026 ökar sökningar relaterade till sökordet "fotboll".VTV.vn – Enligt data från Cốc Cốc Research har antalet sökningar efter sökord som innehåller ordet "VM" ökat med 1 550 % sedan öppningsdagen jämfört med en månad före turneringen, medan sökordsgruppen "Fotboll" har ökat med 480 %.
Var inte rädd för att "misslyckas med ditt förstahandsval": Ett svar från Trung Anh 1977 Vlogs "tidsresande" resa.
Var inte rädd för att "misslyckas med ditt förstahandsval": Ett svar från Trung Anh 1977 Vlogs "tidsresande" resa.VTV.vn - Efter att ha misslyckats med att komma in på sin drömskola anser Trung Anh - medgrundare av 1977 Vlog - att det läskigaste vid 18 års ålder inte är att misslyckas med ett prov, utan att låta misslyckanden hindra en från att gå framåt.
Studenter födda 2008 väljer proaktivt att ansöka baserat på sina akademiska betyg för att säkra en plats i populära huvudämnen.
Studenter födda 2008 väljer proaktivt att ansöka baserat på sina akademiska betyg för att säkra en plats i populära huvudämnen.VTV.vn - Istället för att vänta på gränsvärdena för offentliga skolor väljer många kandidater och föräldrar att ansöka till internationella program baserat på sina akademiska betyg som en lösning för att minska pressen och öka sina chanser att bli antagna.
video AI anh 2

Meningslösa undertexter är svåra att ta bort på Veo 3. Foto: Technology Review .

När Weiss rapporterade problemet till Google Labs via Discord i hopp om att få tillbaka sina bortkastade krediter, hänvisade supportteamet henne till företagets officiella supportavdelning. De erbjöd återbetalning för Veo 3-prenumerationsavgiften, men inte för krediterna. Weiss vägrade eftersom det skulle innebära att hon förlorade åtkomsten till modellen om hon accepterade återbetalningen.

Google Labs Discord-supportteamet uppgav att undertexter kan aktiveras automatiskt om röst upptäcks, och de arbetar med att åtgärda detta fel.

Problemet härrör från Googles tillvägagångssätt.

Anledningen till att Veo 3 automatiskt infogar undertexter härrör från de data som modellen tränades på.

Även om Google inte har släppt detaljer om de datakategorier som används för att träna sina modeller, inkluderar det sannolikt videor från plattformar som YouTube och TikTok, av vilka många innehåller undertexter. Dessa undertexter är inbäddade direkt i videobildrutorna, vilket gör dem svåra att ta bort innan de används som träningsdata, enligt Shuo Niu, forskare inom videodelningsplattformar och AI vid Clark University (Massachusetts, USA).

"Text-till-video-modeller tränas med hjälp av förstärkningsinlärning för att skapa innehåll som efterliknar människoskapade videor, och om dessa videor har undertexter kan modellen 'lära sig' att lägga till undertexter gör produkten mer lik en människoskapad video", förklarade han.

video AI anh 3

Veo 3 påverkades av modellträningsdata från YouTube och TikTok-videor. Bild: Mashable .

En talesperson för Google sa: ”Vi förbättrar ständigt våra möjligheter att skapa videor, särskilt när det gäller text, naturligt klingande röst och perfekt synkroniserat ljud. Vi uppmuntrar användare att försöka igen om de tycker att resultaten är inkonsekventa och ge oss feedback via gilla- eller ogilla-funktionen.”

Vietnam uppmuntrar amerikanska företag att utöka investeringarna i högteknologi.
Vietnam uppmuntrar amerikanska företag att utöka investeringarna i högteknologi.På morgonen den 26 juni tog vice premiärminister Ho Quoc Dung emot Jeff Place, chef för leveranskedjan på Coherent Group (USA), på regeringshögkvarteret. Under mötet bekräftade vice premiärministern att Vietnam uppmuntrar amerikanska företag att expandera investeringar, särskilt inom högteknologi, innovation och halvledarindustrin.
Uppmuntra amerikanska företag att utöka investeringarna i högteknologiska sektorer.
Uppmuntra amerikanska företag att utöka investeringarna i högteknologiska sektorer.Vice premiärminister Ho Quoc Dung sade att Vietnam välkomnar amerikanska företag att fortsätta expandera sin verksamhet i Vietnam, särskilt inom högteknologiska industrier och sektorer med högt mervärde.
Vietnam och USA stärker samarbetet för att hantera konsekvenserna av kriget.
Vietnam och USA stärker samarbetet för att hantera konsekvenserna av kriget.VTV.vn - Den 22 juni tog generalsekreterare och president To Lam emot den amerikanska flottans tillförordnade sekreterare Hung Cao.

Dessutom är anledningen till att denna modell ignorerar uppmaningar som "Inga undertexter" att negativa uttalanden (som instruerar AI:n att inte göra något) i allmänhet är mindre effektiva än bekräftande uppmaningar, enligt Tuhin Chakrabarty, forskare inom AI-system vid Stony Brook University.

För att helt lösa problemet måste Google undersöka varje bildruta i alla videor som används för att träna Veo 3, och sedan ta bort eller omnamnge videor med undertexter innan modellen tränas om. Detta kommer att ta veckor, tillade Chakrabarty.

Katerina Cizek, dokumentärfilmare och art director på MIT Open Documentary Lab, menar att det här problemet visar Googles vilja att släppa produkter som ännu inte är helt färdiga.

”Google behöver en seger”, konstaterade Cizek. ”De måste vara först med att släppa ett verktyg som kan skapa ljud som matchar läpprörelser. Och det är viktigare än att åtgärda problemet med undertexterna.”

Källa: https://znews.vn/van-de-lon-cua-veo-3-post1569402.html

Trender efter kategori

Mest läst

Google Trends

Av samma författare

Arv

Figur

Företag

Aktuella frågor

Politiskt system

Lokal

Produkt

Happy Vietnam
En plats där "lycka" inte behöver en tolk

En plats där "lycka" inte behöver en tolk

Hantverkets själ

Hantverkets själ

Bevarar brokadens själ

Bevarar brokadens själ