Forrige uke forsvarte den vietnamesiske doktorgradsstudenten Trinh Hoang Trieu sin doktoravhandling om problemløsning med kunstig intelligens ved New York University. Forskningen, sammen med bidrag fra to forskere ved Google DeepMind, Dr. Le Viet Quoc og Luong Thang, ble publisert i tidsskriftet Nature.

Med et sett på 30 olympiske geometriproblemer fra 2000 til 2022 løste AlphaGeometry 25 problemer, sammenlignet med den gjennomsnittlige poengsummen for gullmedaljevinnere på 25,9, og overgikk dermed 10 problemer fra datamatematikksystemer utviklet på 1970-tallet.

skjermbilde 2024 01 18 kl. 134500.png
Medlemmer av AlphaGeometry, fra venstre, inkluderer Yuhuai Wu, Trinh Hoang Trieu, Le Viet Quoc og Luong Thang. Foto: WashingtonPost

De siste årene har Google DeepMind drevet med en rekke AI-forskningsprosjekter relatert til matematikk. Derfor brukes problemer på olympiadnivå som kriterier for å evaluere maskinlæring.

Ifølge Michael Barany, en matematikkhistoriker ved University of Edinburgh, er AlphaGeometry-forskningen «en milepæl i evnen til å resonnere autonomt på menneskelig nivå».

Terence Tao, en matematiker fra University of California som vant en olympisk gullmedalje i en alder av 12 år, kalte AI-systemet en «fantastisk prestasjon» og sa at resultatene var «overraskende».

skjermbilde 2024 01 18 kl. 134155.png
Forskning på alfageometri ble publisert i det vitenskapelige tidsskriftet Nature.

I mellomtiden sa forfatteren av studien, Trinh Hoang Trieu, at matematisk resonnement bare er en form for resonnement, men har fordelen av å være lett å verifisere. «Matematikk er sannhetens språk», sa den vietnamesiske legen. «Hvis du vil utvikle et AI-system, må du bygge en pålitelig AI som kan finne sannheten som brukerne kan stole på», spesielt i applikasjoner med høye sikkerhetskrav.

AlphaGeometry er et system som kombinerer en språkmodell for nevrale nettverk (dypt forankret i kunstig intuisjon, lik ChatGPT, men mindre) med en symbolsk motor (spesialisert på kunstig resonnement, som en logisk datamaskin), før den finjusteres for å forstå geometri.

Det spesielle med algoritmen er at den kan generere en løsning fra ingenting. Nåværende AI-modeller, derimot, må søke etter eksisterende eller lignende løsninger som mennesker har funnet.

Resultatene var basert på et nevralt nettverk trent på 100 millioner geometriske eksempler uten menneskelige svar. Når det begynte å jobbe med et problem, ville symbolmotoren fungere først. Hvis det satt fast, ville den nevrale algoritmen foreslå måter å forbedre argumentet på. Denne løkken fortsatte til tiden gikk ut (fire og en halv time) eller problemet var løst.

Stanislas Dehaene, en kognitiv nevroforsker ved College de France, sa at han var imponert over AlphaGeometry sin ytelse, men systemet «oppfatter ingenting om problemet det løser». Med andre ord behandler algoritmen bare de logiske og numeriske kodingene av bilder. «Den har ingen romlig bevissthet om sirkler, linjer eller trekanter.»

Dr. Luong Thang sa at dette «sensoriske» elementet kunne legges til i år, ved hjelp av Googles Gemini AI-plattform.

(Ifølge Washington Post)

Generativ AI dominerer diskusjonene i Davos Den raske utviklingen av kunstig intelligens (AI) dominerte private og offentlige diskusjoner på World Economic Forum, der de største teknologiselskapene, inkludert Salesforce, Microsoft og Google, viste frem musklene.