Vorige week verdedigde de Vietnamese promovendus Trinh Hoang Trieu met succes zijn proefschrift over het onderwerp AI-probleemoplossing aan de New York University. Het onderzoek, samen met bijdragen van twee wetenschappers van Google DeepMind, Dr. Le Viet Quoc en Luong Thang, werd gepubliceerd in het tijdschrift Nature.

Met een set van 30 meetkundige problemen uit de Olympische Spelen van 2000 tot en met 2022 loste AlphaGeometry 25 problemen op. De gemiddelde score van goudenmedaillewinnaars was 25,9. Daarmee overtrof het de 10 problemen van computerwiskundige systemen die in de jaren 70 waren ontwikkeld, ruimschoots.

screenshot 2024 01 18 op 134500.png
Leden van AlphaGeometry, van links naar rechts, zijn onder andere Yuhuai Wu, Trinh Hoang Trieu, Le Viet Quoc en Luong Thang. Foto: WashingtonPost

Google DeepMind heeft de afgelopen jaren een aantal AI-onderzoeksprojecten uitgevoerd die verband houden met wiskunde. Daarom worden problemen op Olympiade-niveau gebruikt als criteria voor de evaluatie van machine learning.

Volgens Michael Barany, historicus van de wiskunde aan de Universiteit van Edinburgh, is het AlphaGeometry-onderzoek “een mijlpaal in het vermogen om autonoom te redeneren op menselijk niveau.”

Terence Tao, een wiskundige aan de Universiteit van Californië die op 12-jarige leeftijd een Olympische gouden medaille won, noemde het AI-systeem een ​​"fantastische prestatie" en zei dat de resultaten "verrassend" waren.

screenshot 2024 01 18 om 134155.png
Het onderzoek naar AlphaGeometry is gepubliceerd in het wetenschappelijke tijdschrift Nature.

Ondertussen zei de auteur van de studie, Trinh Hoang Trieu, dat wiskundig redeneren slechts een vorm van redeneren is, maar het voordeel heeft dat het gemakkelijk te verifiëren is. "Wiskunde is de taal van de waarheid", zei de Vietnamese arts. "Als je een AI-systeem wilt ontwikkelen, moet je een betrouwbare AI bouwen die de waarheid kan vinden waar gebruikers op kunnen vertrouwen", vooral in toepassingen met hoge veiligheidseisen.

AlphaGeometry is een systeem dat een neuraal netwerktaalmodel (diepgaand in kunstmatige intuïtie, vergelijkbaar met ChatGPT maar kleiner) combineert met een symbolische engine (gespecialiseerd in kunstmatig redeneren, zoals een logische computer). Vervolgens wordt het systeem verfijnd om geometrie te begrijpen.

Het bijzondere aan het algoritme is dat het uit het niets een oplossing kan genereren. Huidige AI-modellen daarentegen moeten zoeken naar bestaande of vergelijkbare oplossingen die mensen hebben gevonden.

De resultaten waren gebaseerd op een neuraal netwerk dat getraind was met 100 miljoen geometrische voorbeelden zonder menselijke antwoorden. Wanneer het netwerk aan een probleem begon te werken, werkte de symbolische engine als eerste. Als het vastliep, stelde het neurale algoritme manieren voor om de redenering te verbeteren. Deze lus ging door totdat de tijd om was (vier en een half uur) of het probleem was opgelost.

Stanislas Dehaene, cognitief neurowetenschapper aan het Collège de France, zei dat hij onder de indruk was van de prestaties van AlphaGeometry, maar dat het systeem "niets waarneemt van het probleem dat het oplost". Met andere woorden, het algoritme verwerkt alleen de logische en numerieke coderingen van afbeeldingen. "Het heeft geen ruimtelijk besef van cirkels, lijnen of driehoeken."

Dr. Luong Thang zei dat dit "sensorische" element dit jaar zou kunnen worden toegevoegd met behulp van het Gemini AI-platform van Google.

(Volgens de Washington Post)

Generatieve AI domineert discussies in Davos De snelle ontwikkeling van kunstmatige intelligentie (AI) domineerde de besloten en publieke discussies op het World Economic Forum, waar de grootste technologiebedrijven, waaronder Salesforce, Microsoft en Google, hun spierballen lieten zien.