Vietnam.vn - Nền tảng quảng bá Việt Nam

Det store problem med Veo 3

Denne AI-model indsætter automatisk rodede, meningsløse undertekster i videoer mere end en måned efter lanceringen. Denne situation viser, at Google er villig til at udgive ufærdige produkter for at demonstrere sine AI-muligheder.

ZNewsZNews19/07/2025

Veo3 er Googles seneste AI-model, der blev lanceret i slutningen af ​​maj, og som giver brugerne mulighed for at lave videoer baseret på stemmekommandoer. Denne model har tiltrukket sig opmærksomhed fra indholdsskabelsesmiljøet, da den muliggør oprettelse af videoer med lyd og dialog, en funktion der ikke var tilgængelig i tidligere versioner af Googles model, hvilket gør dem mere realistiske.

Mange brugere bruger Veo 3-videoklip, op til 8 sekunder lange, til at lave reklamer, ASMR-videoer, fantasy-filmtrailere og humoristiske gadeinterviews.

Den Oscar-nominerede instruktør Darren Aronofsky brugte værktøjet til at lave en kortfilm kaldet Ancestra. På pressekonferencen sammenlignede Google DeepMinds administrerende direktør, Demis Hassabis, Veo 3 med et skridt "ud af stumfilmsæraen" i filmverdenen.

"Vedvarende" undertekster fra Veo 3

Mange brugere har dog oplevet, at dette værktøj ikke fungerer som forventet. Når man opretter klip med dialog, indsætter Veo 3 ofte automatisk meningsløse, rodede undertekster, selvom kommandoen tydeligt angiver, at man ikke skal tilføje undertekster.

Det er ikke nemt at fjerne disse undertekster. Brugere er tvunget til at genskabe klippet, bruge "tokens", hvilket betyder at bruge flere penge på Google, eller bruge eksterne værktøjer til at fjerne underteksterne, eller trimme videoen for at fjerne underteksterne.

video AI anh 1

Veo 3 producerer realistisk grafik og dialog, der matcher læbebevægelser, men underteksterne er meningsløse. Foto: Lesswrong .

Josh Woodward, vicepræsident for Google Labs og Gemini, skrev på X den 9. juni, at Google havde udviklet programrettelser til at reducere spamproblemet. Men mere end en måned senere fortsætter brugerne med at rapportere dette problem på Google Labs' Discord-kanal, hvilket viser, at det ikke er let at rette fejl i store AI-modeller.

Ligesom Googles tidligere modeller til oprettelse af AI-videoer er Veo 3 en betalt model, der starter ved $249,99 om måneden. For at oprette en 8-sekunders video indtaster brugerne en beskrivelse i Flow, Gemini eller en anden platform. Hver klipoprettelse med Veo 3 koster mindst 20 AI-kreditter, og brugere kan fylde op med $25 for 2.500 kreditter.

Mona Weiss, en kommerciel direktør, siger, at genskabelse af optagelser for at fjerne undertekster er ved at blive en betydelig udgift. "Hvis du opretter en scene med dialog ved hjælp af Veo3, vil omkring 40% af outputtet have meningsløse undertekster, der gør videoen ubrugelig," siger hun. "Det koster mange penge at få en scene, man kan lide, men den ender med at være ubrugelig."

Du vil måske også synes om
Australien introducerer færdigheder i at bekæmpe falske nyheder i skoler i AI's tidsalder.
Australien introducerer færdigheder i at bekæmpe falske nyheder i skoler i AI's tidsalder.VTV.vn - Stillet over for eksplosionen af ​​AI og digitalt indhold implementerer Australien programmer, der skal hjælpe studerende med at udvikle kritisk tænkning, verificere information og identificere falske nyheder.
Studerende født i 2008 vælger proaktivt at ansøge baseret på deres akademiske udskrifter for at sikre en plads på populære hovedfag.
Studerende født i 2008 vælger proaktivt at ansøge baseret på deres akademiske udskrifter for at sikre en plads på populære hovedfag.VTV.vn - I stedet for at vente på de offentlige skolers grænseværdier, vælger mange kandidater og forældre at ansøge om internationale programmer baseret på deres akademiske udskrifter som en løsning på at reducere presset og øge deres chancer for optagelse.
Når den smarte fabrik ikke længere er defineret af automatisering.
Når den smarte fabrik ikke længere er defineret af automatisering.VTV.vn - Smarte fabrikker går ind i en ny udviklingsfase, hvor AI, energistyring og digitale økosystemer bliver fundamentet for moderne produktion.
video AI anh 2

Meningsløse undertekster er vanskelige at fjerne på Veo 3. Foto: Technology Review .

Da Weiss rapporterede problemet til Google Labs via Discord i håb om at få sine spildte kreditter tilbage, henviste supportteamet hende til virksomhedens officielle supportafdeling. De tilbød en refusion af Veo 3-abonnementsgebyret, men ikke af kreditterne. Weiss afslog, fordi det ville betyde, at hun mistede adgangen til modellen, hvis hun accepterede refusionen.

Google Labs Discord-supportteamet oplyste, at undertekster muligvis aktiveres automatisk, hvis der registreres stemme, og de arbejder på at rette denne fejl.

Problemet stammer fra Googles tilgang.

Grunden til, at Veo 3 automatisk indsætter undertekster, stammer fra de data, som modellen blev trænet på.

Selvom Google ikke har frigivet detaljer om de datakategorier, der bruges til at træne sine modeller, inkluderer det sandsynligvis videoer fra platforme som YouTube og TikTok, hvoraf mange indeholder undertekster. Disse undertekster er integreret direkte i videobillederne, hvilket gør dem vanskelige at fjerne, før de bruges som træningsdata, ifølge Shuo Niu, en forsker i videodelingsplatforme og AI ved Clark University (Massachusetts, USA).

"Tekst-til-video-modeller trænes ved hjælp af forstærkningslæring til at skabe indhold, der efterligner menneskeskabte videoer, og hvis disse videoer har undertekster, kan modellen 'lære', at tilføjelse af undertekster gør produktet mere som en menneskeskabt video," forklarede han.

video AI anh 3

Veo 3 blev påvirket af modeltræningsdata fra YouTube og TikTok-videoer. Billede: Mashable .

En talsperson fra Google udtalte: "Vi forbedrer konstant vores muligheder for at oprette videoer, især med hensyn til tekst, naturlig stemme og perfekt synkroniseret lyd. Vi opfordrer brugerne til at prøve kommandoen igen, hvis de finder resultaterne inkonsekvente, og give os feedback via funktionen "synes godt om" eller "synes ikke godt om".

Vietnam opfordrer amerikanske virksomheder til at udvide investeringerne i højteknologi.
Vietnam opfordrer amerikanske virksomheder til at udvide investeringerne i højteknologi.Om morgenen den 26. juni modtog vicepremierminister Ho Quoc Dung Jeff Place, forsyningskædedirektør for Coherent Group (USA), i regeringens hovedkvarter. Under mødet bekræftede vicepremierministeren, at Vietnam opfordrer amerikanske virksomheder til at udvide investeringerne, især inden for højteknologi, innovation og halvlederindustrier.
Opfordre amerikanske virksomheder til at udvide investeringer i højteknologiske sektorer.
Opfordre amerikanske virksomheder til at udvide investeringer i højteknologiske sektorer.Vicepremierminister Ho Quoc Dung sagde, at Vietnam byder amerikanske virksomheder velkommen til at fortsætte med at udvide deres aktiviteter i Vietnam, især inden for højteknologiske industrier og sektorer med høj merværdi.
Vietnam og USA styrker samarbejdet om at håndtere konsekvenserne af krigen.
Vietnam og USA styrker samarbejdet om at håndtere konsekvenserne af krigen.VTV.vn - Den 22. juni modtog generalsekretær og præsident To Lam den fungerende sekretær for den amerikanske flåde, Hung Cao.

Desuden er årsagen til, at denne model ignorerer prompts som "Ingen undertekster", at negative udsagn (der instruerer AI'en i ikke at gøre noget) generelt er mindre effektive end bekræftende prompts, ifølge Tuhin Chakrabarty, en forsker i AI-systemer ved Stony Brook University.

For at løse problemet fuldstændigt skal Google undersøge alle billeder i alle videoer, der bruges til at træne Veo 3, og derefter fjerne eller omdøbe videoer med undertekster, før modellen trænes om. Dette vil tage uger, tilføjede Chakrabarty.

Katerina Cizek, dokumentarist og art director ved MIT Open Documentary Lab, argumenterer for, at dette problem demonstrerer Googles villighed til at udgive produkter, der endnu ikke er helt færdige.

"Google har brug for en sejr," udtalte Cizek. "De skal være de første til at udgive et værktøj, der kan skabe lyd, der matcher læbebevægelser. Og det er vigtigere end at løse problemet med underteksterne."

Kilde: https://znews.vn/van-de-lon-cua-veo-3-post1569402.html

Tendenser efter kategori

Mest læst

Google Trends

Samme forfatter

Arv

Figur

Virksomheder

Aktuelle begivenheder

Politisk system

Lokal

Produkt

Happy Vietnam
SKYGGEMALERI

SKYGGEMALERI

Fejring af månenytår på Phu Yen General Hospital

Fejring af månenytår på Phu Yen General Hospital

Bevarelse af brokadens sjæl

Bevarelse af brokadens sjæl