Kan AI echt denken?

Bedrijven zoals OpenAI en DeepSeek verleggen de grenzen van logische chatbots, die bij bepaalde computertaken beter kunnen presteren.

ZNews•06/04/2025

De chatbot van OpenAI wordt voortdurend verbeterd door nieuwe technologieën. Foto: New York Times .

In september 2024 lanceerde OpenAI ChatGPT, een versie van de AI die het o1-model integreert en in staat is tot redeneren in taken die verband houden met wiskunde, wetenschap en computerprogrammering.

In tegenstelling tot de vorige versie van ChatGPT, zal de nieuwe technologie de tijd nemen om oplossingen voor complexe problemen te bedenken voordat er een antwoord wordt gegeven.

Na OpenAI hebben veel concurrenten, zoals Google, Anthropic en DeepSeek, ook vergelijkbare redeneermodellen geïntroduceerd. Hoewel niet perfect, is dit toch een technologie voor het upgraden van chatbots waar veel ontwikkelaars op vertrouwen.

Hoe AI redeneert

In essentie betekent redeneren dat chatbots meer tijd kunnen besteden aan het oplossen van problemen die door gebruikers worden gesteld.

"Redeneren is hoe het systeem extra werk verricht nadat het een vraag heeft ontvangen," vertelde Dan Klein, hoogleraar informatica aan de Universiteit van Californië, aan de New York Times .

Een logisch systeem kan een probleem opsplitsen in kleinere, afzonderlijke stappen, of het oplossen door middel van vallen en opstaan.

Toen ChatGPT voor het eerst werd gelanceerd, kon het direct vragen beantwoorden door informatie te verzamelen en te synthetiseren. Redeneersystemen hadden daarentegen een paar seconden (of zelfs minuten) langer nodig om het probleem op te lossen en een antwoord te geven.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 1

Een voorbeeld van het redeneerproces van het O1-model in een chatbot voor klantenservice. Afbeelding: OpenAI .

In sommige gevallen zal het redeneersysteem zijn aanpak van het probleem aanpassen en de oplossing continu verbeteren. Daarnaast kan het model meerdere oplossingen testen voordat een optimale keuze wordt gemaakt, of de nauwkeurigheid van eerdere antwoorden controleren.

Over het algemeen zal het redeneersysteem alle mogelijke antwoorden op de vraag overwegen. Dit is vergelijkbaar met basisschoolleerlingen die veel opties op papier schrijven voordat ze de meest geschikte oplossing voor een wiskundeprobleem kiezen.

Volgens de New York Times is AI nu in staat om over vrijwel elk onderwerp te redeneren. Het zal echter het meest effectief zijn bij vragen die verband houden met wiskunde, wetenschap en computerprogrammering.

Hoe wordt het theoretische systeem getraind?

Bij een typische chatbot kunnen gebruikers nog steeds om uitleg over het proces vragen of de juistheid van het antwoord controleren. Sterker nog, veel trainingsdatasets voor ChatGPT bevatten al procedures voor probleemoplossing.

Het redeneersysteem wordt nog geavanceerder wanneer het bewerkingen kan uitvoeren zonder input van de gebruiker. Dit proces is complexer en uitgebreider. Bedrijven gebruiken het woord 'redeneren' omdat het systeem op een vergelijkbare manier werkt als hoe mensen denken.

Veel bedrijven, zoals OpenAI, verwachten dat redeneersystemen de beste oplossing zijn om de momenteel beschikbare chatbots te verbeteren. Jarenlang waren ze ervan overtuigd dat chatbots beter presteerden naarmate ze meer informatie van het internet verwerkten.

Tegen 2024 zullen AI-systemen vrijwel alle beschikbare tekst op het internet hebben gebruikt. Dit betekent dat bedrijven nieuwe oplossingen moeten vinden om chatbots te verbeteren, waaronder redeneersystemen.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 2

De startup DeepSeek zorgde ooit voor opschudding met zijn redeneermodel dat lagere kosten had dan OpenAI. Foto: Bloomberg .

Sinds vorig jaar richten bedrijven zoals OpenAI zich op versterkingsleren. Dit proces duurt doorgaans enkele maanden, waarin de AI gedrag leert door middel van vallen en opstaan.

Door bijvoorbeeld duizenden problemen op te lossen, kan het systeem de optimale methode vinden om tot het juiste antwoord te komen. Vervolgens ontwikkelen onderzoekers geavanceerde feedbackmechanismen die het systeem helpen onderscheid te maken tussen correcte en incorrecte oplossingen.

"Het is vergelijkbaar met het trainen van een hond. Als het systeem goed werkt, geef je hem een snoepje. Zo niet, dan zeg je: 'Die hond is stout'," aldus Jerry Tworek, onderzoeker bij OpenAI.

Is AI de toekomst?

Volgens de New York Times zijn versterkingsleermethoden effectief bij het voldoen aan eisen in de wiskunde, natuurwetenschappen en computerprogrammering. Dit zijn vakgebieden waar juiste of onjuiste antwoorden duidelijk gedefinieerd kunnen worden.

Omgekeerd is reinforcement learning ineffectief in vakgebieden zoals schrijven, filosofie en ethiek – gebieden waar het moeilijk is om onderscheid te maken tussen goed en kwaad. Desondanks beweren onderzoekers dat deze techniek de prestaties van AI nog steeds kan verbeteren, zelfs bij niet-mathematische vraagstukken.

"Systemen leren de paden die leiden tot positieve en negatieve uitkomsten," aldus Jared Kaplan, Chief Scientific Officer bij Anthropic.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 3

Website van Anthropic, de startup die eigenaar is van het Claude AI-model. Foto: Bloomberg .

Het is belangrijk om te benadrukken dat reinforcement learning en redeneersystemen twee verschillende concepten zijn. Reinforcement learning is met name een methode om redeneersystemen te bouwen. Dit is de laatste trainingsfase die chatbots in staat stelt te redeneren.

Omdat het nog relatief nieuw is, kunnen wetenschappers er nog niet zeker van zijn of redeneren met chatbots of bekrachtigingsleren AI kan helpen om als mens te denken. Het is belangrijk om te weten dat veel huidige trends in AI-training zich in het begin zeer snel ontwikkelen en daarna geleidelijk vertragen.

Bovendien kunnen chatbots nog steeds fouten maken in hun redenering. Op basis van waarschijnlijkheid kiest het systeem het proces dat het meest lijkt op de gegevens die het heeft geleerd, of die nu afkomstig zijn van internet of via reinforcement learning. Daarom kunnen chatbots nog steeds onjuiste of onlogische oplossingen kiezen.

Bron: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html