OpenAIs Sora heller kaldt vann på Kinas AI-drømmer

[annonse_1]

For bare noen få år siden så Kina for seg at de til slutt ville dominere den globale AI-kappløpet ved å utnytte landets enorme datagrunnlag til å utvikle applikasjoner som ansiktsgjenkjenning.

Nyere utvikling innen generativ AI – bruk av store modeller til å produsere innhold som tekst, bilder og video – har endret balansen, og etterlot Kina igjen som et land som har ligget etternølt.

Soras lansering 16. februar kommer samtidig som Kina står overfor en økende utfordring med å bli avskåret fra Nvidias avanserte grafikkprosessorer (GPU-er) på grunn av økende amerikanske eksportrestriksjoner. Landets beste AI-spillere ligger flere år bak sine utenlandske motparter.

Zhou Hongyi, grunnleggeren av internettsikkerhetsfirmaet 360 Security Technology, kalte Sora «en bøtte med kaldt vann helt over Kina», rapporterte Yicai 23. februar. Han sa at det hjalp mange mennesker med å se gapet mellom dem og verdensledere .

OpenAI har ennå ikke gitt Sora ut til offentligheten. Det er ikke åpen kildekode som noen av forgjengerne. Bare et begrenset antall personer har tilgang til en prøveversjon av Sora.

OpenAIs Sora hjelper kinesiske teknologiselskaper med å innse gapet mellom dem og verdens ledende AI-teknologier. (Foto: SCMP)

I Kina krever den nasjonale cyberspace-administrasjonen at alle offentlige store språkmodeller (LLM-er) registreres hos myndighetene. Verdensgiganter som OpenAI og Google har ennå ikke offisielt levert tjenester her.

Dette fraværet har ført til at mange innenlandske teknologigiganter kjemper om posisjoner i markedet med mer enn 200 LLM-er. Baidu, Tencent og Alibaba har alle introdusert sine egne LLM-er.

Det er imidlertid få verktøy som kan sammenlignes med Sora, delvis fordi de ennå ikke bruker den nye Diffusion Transformer (DiT)-arkitekturen. TikTok-morselskapet ByteDance sa at deres interne videobevegelseskontrollverktøy Boximator, som brukes til å støtte videoproduksjon, fortsatt er i sin spede begynnelse og ikke klart for masseutgivelse.

Selskapet innrømmer at det er et stort gap mellom Boximator og ledende modeller for videoproduksjon når det gjelder bildekvalitet, gjengivelse og varighet.

I stedet for å ta igjen Sora, ser noen i bransjen det mer presserende problemet som å få tilgang til OpenAIs modeller. Men amerikanske lovgivere ønsker å begrense Kinas tilgang til sine AI-skytjenester.

En ikke navngitt kinesisk utvikler fortalte SCMP at en mulig vei for kinesiske AI-ingeniører er å «først dekode Sora og trene det med sine egne data for å lage et lignende produkt». Xu Liang, en AI-gründer basert i Hangzhou, mener at Kina snart vil ha lignende tjenester, selv om det fortsatt kan være et lite gap mellom kinesiske produkter og Sora.

Wang Shuyi, professor med spesialisering i AI og maskinlæring ved Tianjin Normal University (TJNU), kommenterte: Erfaringen med å utvikle juridiske mastergrader det siste året har gjort det mulig for kinesiske store teknologiselskaper å bygge opp kunnskap på dette feltet og hamstre nødvendig maskinvare, slik at de kan produsere produkter som Sora i løpet av de neste seks månedene.

Noen måneder før Soras lansering lanserte en gruppe forskere VBench, et referanseverktøy for videogenereringsmodeller. VBench-teamet, som inkluderte forskere fra Singapores Nanyang Technological University og Shanghai Artificial Intelligence Lab i Kina, fant ut at Sora overgikk andre modeller i generell videokvalitet, basert på demonstrasjoner levert av OpenAI.

Lu Yanxia, IDC Kinas forskningsdirektør for nye teknologier, sa at teknologigiganter som Baidu, Alibaba og Tencent vil være blant de første til å rulle ut lignende tjenester i landet.

I tillegg vil iFlyTek, SenseTime og Hikvision – som alle står på Washingtons sanksjonsliste – også bli med i kappløpet, sa hun.

Men Kina står fortsatt overfor en oppoverbakke ettersom teknologimarkedet blir stadig mer isolert fra verden når det gjelder kapital, maskinvare, data og til og med mennesker, ifølge analytikere.

Markedsverdiforskjellen mellom Kinas ledende teknologiselskaper og de i USA som Microsoft, Google og Nvidia har økt betydelig de siste årene ettersom Beijing har strammet grepet.

I tillegg, mens Kina en gang ble sett på som et fortrinn når det gjelder datamengde, påpekte Lu at landet nå står overfor en mangel på kvalitetsdata som trengs for å trene nyere modeller, kombinert med utfordringen med begrenset tilgang til avanserte brikker.

Mangelen på talent er en annen bekymring, ifølge ledere i IDC, ettersom de beste og smarteste innen AI ofte har lettere for å skinne ved å jobbe for ledende aktører i USA. Hos OpenAI utgjør for eksempel teknologieksperter fra Kina en kjernegruppe. Av OpenAIs 1677 LinkedIn-medlemmer studerte 23 ved Tsinghua University.

Men selv med nok talent stiller eksperter spørsmål ved hvor langt Kinas hjemmelagde AI kan gå mens de står overfor eksisterende begrensninger fra handelsspenninger mellom USA og Kina.

I en rapport advarte Ping An Securities om at fortsatte forsøk på å begrense eksport av brikker fra USA kunne akselerere modningen av Kinas AI-brikkeindustri, men «innenlandske alternativer kan ikke innfri forventningene».

Washington har blokkert kinesiske selskaper fra å få tilgang til verdens mest avanserte halvledere. I oktober 2023 strammet USA inn regelverket igjen, og blokkerte fastlands-tilgang til GPU-er som Nvidia hadde designet spesielt for kinesiske kunder for å unngå tidligere restriksjoner.

Alexander Harrowell, en avansert dataanalytiker i teknologiforsknings- og konsulentgruppen Omdia, bemerker at Kina har andre alternativer enn GPU-er for LLM-opplæring, som Googles TPU, Huaweis Ascend, AWS’ Trainium eller et av en rekke oppstartsbedrifters tilbud. Det vil imidlertid kreve mer innsats innen programvareutvikling og systemadministrasjon.

Det kinesiske markedet vil ha spesielle muligheter, ifølge gründer Xu, når tekniske rapporter om Sora og videomodellen med åpen kildekode publiseres. «Det vil være en plattform som kinesiske selskaper kan lære av», sa han. Lokale videomodeller støtter også kinesisk bedre, la han til.

(Ifølge SCMP)

[annonse_2]
Kilde