Veo 3:n suurin ongelma

Tämä tekoälymalli lisää automaattisesti sekavia, merkityksettömiä tekstityksiä videoihin yli kuukauden julkaisunsa jälkeen. Tämä osoittaa, että Google on halukas julkaisemaan keskeneräisiä tuotteita osoittaakseen tekoälykykynsä.

ZNews•19/07/2025

Veo3 on Googlen uusin tekoälymalli, joka lanseerattiin toukokuun lopulla. Sen avulla käyttäjät voivat luoda videoita äänikomentojen perusteella. Tämä malli on herättänyt sisällöntuotantoyhteisön huomion, sillä se mahdollistaa videoiden luomisen äänellä ja dialogilla. Tätä ominaisuutta ei ollut saatavilla Googlen mallin aiemmissa versioissa, mikä tekee niistä realistisempia.

Monet käyttäjät käyttävät jopa 8 sekunnin pituisia Veo 3 -videoleikkeitä mainosten, ASMR-videoiden, fantasiaelokuvien trailerien ja humorististen katuhaastattelujen luomiseen.

Oscar-ehdokkaana ollut ohjaaja Darren Aronofsky käytti työkalua luodakseen lyhytelokuvan nimeltä Ancestra. Lehdistötilaisuudessa Google DeepMindin toimitusjohtaja Demis Hassabis vertasi Veo 3:a askeleeseen "ulos mykkäelokuvien aikakaudesta" elokuvateattereissa.

"Persistent"-tekstitykset Veo 3:sta

Monet käyttäjät ovat kuitenkin huomanneet, että tämä työkalu ei toimi odotetulla tavalla. Kun luodaan dialogia sisältäviä leikkeitä, Veo 3 lisää usein automaattisesti merkityksettömiä, sekavia tekstityksiä, vaikka komennossa selvästi ilmoitetaan, ettei tekstityksiä tule lisätä.

Näiden tekstitysten poistaminen ei ole yksinkertaista. Käyttäjät joutuvat luomaan videoleikkeen uudelleen käyttämällä "tokeneita", mikä tarkoittaa enemmän rahaa Googlessa, tai käyttämään ulkoisia työkaluja tekstitysten poistamiseen tai leikkaamaan videota tekstitysten poistamiseksi.

Veo 3 tuottaa realistisia visuaaleja ja huulten liikkeitä vastaavaa dialogia, mutta tekstitykset ovat merkityksettömiä. Kuva: Lesswrong .

Google Labsin ja Geminin varatoimitusjohtaja Josh Woodward julkaisi X:ssä 9. kesäkuuta, että Google oli kehittänyt korjauksia roskapostiongelman vähentämiseksi. Mutta yli kuukausi myöhemmin käyttäjät jatkavat ongelman raportointia Google Labsin Discord-kanavalla, mikä osoittaa, että virheiden korjaaminen suurissa tekoälymalleissa ei ole helppoa.

Kuten Googlen aiemmat tekoälyllä toimivat videoidenluontimallit, Veo 3 on maksullinen malli, jonka lähtöhinta on 249,99 dollaria kuukaudessa. Kahdeksan sekunnin videon luomiseksi käyttäjien on syötettävä kuvaus Flow'hun, Geminiin tai muuhun alustaan. Jokainen Veo 3:lla luotu videoleike maksaa vähintään 20 tekoälykrediittiä, ja käyttäjät voivat ladata 25 dollarilla 2 500 krediitin edestä.

Kaupallinen ohjaaja Mona Weiss sanoo, että tekstitysten poistaminen materiaalista on tulossa merkittäväksi kuluksi. ”Jos luot kohtauksen, jossa on dialogia, Veo3:lla, noin 40 %:ssa tuotoksesta on merkityksettömiä tekstityksiä, jotka tekevät videosta käyttökelvottoman”, hän sanoo. ”Hyvän kohtauksen saaminen maksaa paljon, mutta se on lopulta käyttökelvoton.”

Saatat myös pitää tästä

Kasvun ajurit korkean teknologian soveltamisestaNeljännen teollisen vallankumouksen vahvan kehityksen keskellä tieteestä, teknologiasta, innovaatioista ja digitaalisesta muutoksesta on tulossa keskeisiä kasvun ja kilpailukyvyn parantamisen ajureita. Kalastuksen, maatalouden, jalostuksen, meritalouden, uusiutuvan energian ja ekomatkailun potentiaalin ja etujen hyödyntämiseksi Ca Maun maakunta on julkaissut "Huipputeknologian sovellusprojekti useilla teollisuudenaloilla ja aloilla Ca Maun maakunnassa, 2026–2030", jossa korkea teknologia tunnistetaan läpimurtoratkaisuksi kasvun laadun, lisäarvon ja kestävän kehityksen parantamiseksi.

Hakkerit varastivat oikeita kuvia iPhone 18 Prosta.Hakkerit hyökkäsivät merkittävän Applen komponenttitoimittajan kimppuun Intiassa ja varastivat tärkeitä tietoja iPhone 18 Prosta.

Miten Elon Muskin Starlink-satelliitti-internetpalvelu toimii tällä hetkellä Vietnamissa?Starlink Services Vietnamin (Elon Muskin Space X:n tytäryhtiö) pääjohtaja Do Ba Thich sanoi, että he valmistelevat parhaillaan infrastruktuuria Starlink-satelliitti-internetpalvelun tarjoamiseksi, eivätkä ole vielä paljastaneet Vietnamin laukaisupäivää.

Merkityksettömiä tekstityksiä on vaikea poistaa Veo 3:ssa. Kuva: Technology Review .

Kun Weiss ilmoitti ongelmasta Google Labsille Discordin kautta toivoen saavansa hukkaan heitetyt krediittinsä takaisin, tukitiimi ohjasi hänet yrityksen viralliselle tukiosastolle. He tarjosivat hyvitystä Veo 3 -tilausmaksusta, mutta eivät krediiteistä. Weiss kieltäytyi, koska hyvityksen hyväksyminen tarkoittaisi mallin käyttöoikeuden menettämistä.

Google Labsin Discord-tukitiimi ilmoitti, että tekstitykset saattavat aktivoitua automaattisesti, jos ääntä havaitaan, ja he työskentelevät tämän virheen korjaamiseksi.

Ongelma johtuu Googlen lähestymistavasta.

Syy siihen, miksi Veo 3 lisää tekstitykset automaattisesti, johtuu datasta, jonka pohjalta mallia on koulutettu.

Vaikka Google ei ole julkaissut tietoja malliensa kouluttamiseen käytetyistä dataluokista, se todennäköisesti sisältää videoita alustoilta, kuten YouTube ja TikTok, joista monissa on tekstityksiä. Nämä tekstitykset on upotettu suoraan videoruutuihin, minkä vuoksi niitä on vaikea poistaa ennen kuin niitä käytetään koulutusdatana, kertoo Shuo Niu, videonjakoalustojen ja tekoälyn tutkija Clarkin yliopistosta (Massachusetts, Yhdysvallat).

"Tekstistä videoksi -malleja koulutetaan vahvistusoppimisen avulla luomaan sisältöä, joka jäljittelee ihmisen tekemiä videoita, ja jos näissä videoissa on tekstitykset, malli voi 'oppia', että tekstitysten lisääminen tekee tuotteesta enemmän ihmisen tekemän videon kaltaisen", hän selitti.

YouTuben ja TikTok-videoiden mallinkoulutusdata vaikutti Veo 3:een. Kuva: Mashable .

Googlen tiedottaja sanoi: ”Parannamme jatkuvasti videoiden luontikykyjämme, erityisesti tekstin, luonnolliselta kuulostavan äänen ja täydellisesti synkronoidun äänen osalta. Kannustamme käyttäjiä yrittämään komentoa uudelleen, jos he kokevat tulokset epäjohdonmukaisiksi, ja antamaan meille palautetta tykkää- tai ei-tykkää-toiminnon kautta.”

Yhdysvallat - Vietnam: Älä missaa

Vietnam kannustaa yhdysvaltalaisia yrityksiä laajentamaan investointejaan korkean teknologian alalla.Kesäkuun 26. päivän aamuna hallituksen päämajassa varapääministeri Ho Quoc Dung otti vastaan Coherent Groupin (USA) toimitusketjun johtajan Jeff Placen. Tapaamisen aikana varapääministeri vahvisti, että Vietnam kannustaa yhdysvaltalaisia yrityksiä laajentamaan investointejaan, erityisesti korkean teknologian, innovaatioiden ja puolijohdeteollisuuden aloille.

Kannusta yhdysvaltalaisia yrityksiä laajentamaan investointejaan korkean teknologian aloille.Varapääministeri Ho Quoc Dung sanoi, että Vietnam toivottaa yhdysvaltalaiset yritykset tervetulleiksi jatkamaan toimintansa laajentamista Vietnamissa, erityisesti korkean teknologian ja korkean lisäarvon aloilla.

Vietnam ja Yhdysvallat vahvistavat yhteistyötään sodan seurausten torjumiseksi.VTV.vn - Yhdysvaltain laivaston pääsihteeri ja presidentti To Lam otti vastaan Yhdysvaltain laivaston vt. sihteerin Hung Caon 22. kesäkuuta.

Lisäksi syy siihen, miksi tämä malli jättää huomiotta kehotteet, kuten "Ei tekstityksiä", on se, että negatiiviset lauseet (jotka kehottavat tekoälyä olemaan tekemättä jotain) ovat yleensä vähemmän tehokkaita kuin myöntävät kehotteet, sanoo Stony Brookin yliopiston tekoälyjärjestelmien tutkija Tuhin Chakrabarty.

Ongelman täydelliseksi ratkaisemiseksi Googlen on tutkittava jokainen ruutu kaikista Veo 3:n kouluttamiseen käytetyistä videoista ja sitten poistettava tai nimettävä uudelleen tekstitetyt videot ennen mallin uudelleenkoulutusta. Tämä vie viikkoja, Chakrabarty lisäsi.

Katerina Cizek, dokumenttielokuvantekijä ja MIT Open Documentary Labin taiteellinen johtaja, väittää, että tämä numero osoittaa Googlen halukkuutta julkaista tuotteita, jotka eivät ole vielä täysin valmiita.

”Google tarvitsee voiton”, Cizek totesi. ”Heidän täytyy olla ensimmäinen, joka julkaisee työkalun, joka pystyy luomaan ääntä, joka vastaa huulten liikkeitä. Ja se on tärkeämpää kuin tekstitysongelman korjaaminen.”

Lähde: https://znews.vn/van-de-lon-cua-veo-3-post1569402.html

[Kuva] Pääsihteeri ja presidentti To Lam työskentelee hallituksen puoluekomitean kanssa myrskyjen, tulvien, äärimmäisten luonnonkatastrofien ja ilmastonmuutoksen ehkäisemiseksi ja torjumiseksi.

Trendit kategorian mukaan

Asetuksen 168 virallinen muutos: Lasten kuljettaminen ilman turvaistuimia johtaa varoittavaan sakkoon 15. elokuuta alkaen.

Báo Tuổi Trẻ

một giờ trước

Ho Chi Minh Cityn opetus- ja koulutusosasto piti tänä aamuna kello 9 kokouksen 179 lukion rehtorin kanssa tarkistaakseen 10. luokan pääsykokeisiin liittyvät pisteet.

Báo Thanh niên

3 giờ trước

Yli 70 vuotta paahtouunin polttamista: Artesaanikahvin salaisuus, joka saa asiakkaat palaamaan Choloniin.

Portugalilaiset ilotulitteet "hemmottelevat" Han-jokea valoshow'lla.

Auringonnousun katseleminen Phuong Main tuulipuiston yllä.

Tutustu Kon Chu Rangiin sen kauneimpana vuodenaikana.

DOJI ja DOJILAND ovat kiinnittäneet useita miljardien dollarien arvoisia projekteja, mukaan lukien 75-kerroksisen pilvenpiirtäjän.

Báo Nông nghiệp và Môi trường

một giờ trước

50 vuotta siitä, kun Ho Chi Minh City nimettiin presidentti Ho Chi Minhin mukaan: Ho Chi Minh City astuu uuteen kasvun aikakauteen.

Báo Thanh niên

một giờ trước

Valtion budjetista rahoitettujen julkisten investointisuunnitelmien osoittaminen ministeriöille ja kunnille kansallisten tavoiteohjelmien toteuttamiseksi.

Cổng Thông tin điện tử Chính phủ

13 giờ trước

Politbyroon päätöslauselman nro 10-NQ/TW tutkimista, ymmärtämistä ja täytäntöönpanoa käsittelevän kansallisen konferenssin avajaiset.

Báo Quảng Trị

15 phút trước

Parannetaan kotitalousjätteen kaatopaikoille, jätteenkäsittelylaitoksiin ja muihin nimettyihin paikkoihin kuljettamisen sääntelyn koordinointia.

Báo Cần Thơ

17 phút trước

Lich Hoi Thuongin kunta korjasi yli 17 200 tonnia tuoksuvaa riisiä ja erikoisriisiä.

Báo Cần Thơ

17 phút trước

Tuote

Giao Ninhin matkailualueen brändi-identiteetin ja Ninh Binhin maakunnan rannikkokunnille tarkoitettujen yhteisömatkailutuotteiden julkistaminen.

Sở Du lịch tỉnh Ninh Bình

một giờ trước

Veo 3:n suurin ongelma

Tämä tekoälymalli lisää automaattisesti sekavia, merkityksettömiä tekstityksiä videoihin yli kuukauden julkaisunsa jälkeen. Tämä osoittaa, että Google on halukas julkaisemaan keskeneräisiä tuotteita osoittaakseen tekoälykykynsä.

"Persistent"-tekstitykset Veo 3:sta

Ongelma johtuu Googlen lähestymistavasta.

Trendit kategorian mukaan

Lapsi opettelee päässälaskua.

Aamunkoitto koskettaa vehreää maisemaa.

Eteläisten saarten värit