
I programmi di intelligenza artificiale hanno raggiunto molti traguardi importanti negli ultimi anni - Foto: REUTERS
Non possiamo osservare l'intero processo, dall'input dei dati all'output, dei modelli linguistici di grandi dimensioni (LLM).
Per rendere il concetto più comprensibile, gli scienziati hanno utilizzato termini comuni come "ragionamento" per descrivere il funzionamento di questi programmi. Affermano inoltre che i programmi sono in grado di "pensare", "ragionare" e "comprendere" allo stesso modo degli esseri umani.
Esagerare le capacità dell'intelligenza artificiale.
Secondo quanto riportato da ZDNET il 6 settembre, negli ultimi due anni molti dirigenti del settore dell'IA hanno utilizzato un linguaggio esagerato per enfatizzare semplici risultati tecnici.
Nel settembre 2024, OpenAI ha annunciato che il suo modello di ragionamento o1 "utilizza una catena di ragionamenti per risolvere i problemi, in modo simile a come gli esseri umani pensano a lungo quando si trovano di fronte a domande difficili".
Tuttavia, gli scienziati dell'IA non sono d'accordo. Sostengono che l'IA non possieda un'intelligenza simile a quella umana.
Uno studio basato sul database arXiv, condotto da un team di autori dell'Arizona State University (USA), ha testato la capacità di ragionamento dell'intelligenza artificiale attraverso un semplice esperimento.
I risultati suggeriscono che "il riferimento attraverso sequenze di pensiero è una fragile illusione", non un vero meccanismo logico, ma semplicemente una forma sofisticata di riconoscimento di schemi.
Il termine "CoT" (Co-Thought Chain, catena di pensiero collaborativo) permette all'intelligenza artificiale non solo di fornire una risposta finale, ma anche di presentare ogni singolo passaggio del ragionamento logico, come in modelli quali GPT-o1 o DeepSeek V1.

Illustrazione del modello linguistico GPT-2 di OpenAI - Foto: ECHOCRAFTAI
Scopri cosa fa realmente l'intelligenza artificiale.
Il team di ricerca ha affermato che analisi su larga scala hanno dimostrato che LLM tende a basarsi maggiormente sulla semantica e sugli indizi superficiali piuttosto che sui processi di ragionamento logico.
"I modelli LLM costruiscono sequenze logiche superficiali basate su associazioni di input apprese, fallendo spesso in compiti che si discostano dai metodi di ragionamento convenzionali o da schemi familiari", ha spiegato il team.
Per verificare l'ipotesi che LLM si limiti a confrontare i modelli senza effettivamente trarre inferenze, il team di ricerca ha addestrato GPT-2, un modello open-source di OpenAI lanciato nel 2019.
Il modello è stato inizialmente addestrato su compiti molto semplici che coinvolgevano le 26 lettere dell'alfabeto inglese, come ad esempio riorganizzare alcune lettere, cambiando "APPLE" in "EAPPL". Successivamente, il team ha modificato il compito e ha chiesto a GPT-2 di elaborarlo.
I risultati hanno dimostrato che, per i compiti non inclusi nei dati di addestramento, GPT-2 non è stato in grado di risolverli con precisione utilizzando CoT.
Il modello, invece, tenta di applicare i compiti appresi nel modo più fedele possibile. Pertanto, il suo "ragionamento" può sembrare logico, ma i risultati sono spesso errati.
Il gruppo ha concluso che non bisogna fare eccessivo affidamento sulle risposte di LLM né fidarsi ciecamente, poiché possono produrre "affermazioni prive di senso ma molto convincenti".
Hanno inoltre sottolineato la necessità di comprendere la vera natura dell'IA, evitare le esagerazioni e smettere di promuovere l'idea che l'IA possieda capacità di ragionamento simili a quelle umane.
Fonte: https://tuoitre.vn/nghien-cuu-moi-ai-khong-suy-luan-nhu-con-nguoi-20250907152120294.htm










Commento (0)