
Cu cât modelul este mai puternic, cu atât „gândirea” este mai slabă?
Într-un raport publicat recent, cercetătorii Apple au evaluat performanța Modelelor Mari de Raționament (LRM) în gestionarea problemelor logice cu dificultate crescândă, cum ar fi Turnul Hanoi sau problema Traversării Râului .
Rezultatele au fost șocante: atunci când se confruntau cu probleme extrem de complexe, precizia modelelor avansate de inteligență artificială nu numai că se deteriora, dar „se prăbușea complet”.
Ceea ce este și mai îngrijorător este că, înainte ca performanța să scadă vertiginos, modelele au început să-și reducă efortul de raționament, un comportament contrar intuiției, deoarece ar trebui să fie nevoie de mai multă gândire atunci când se confruntă cu o problemă dificilă.
În multe cazuri, chiar și atunci când li se oferă algoritmul corect, modelele tot nu reușesc să ofere o soluție. Acest lucru dezvăluie limitări profunde în capacitatea lor de a se adapta și aplica reguli în medii noi.
Provocarea „teoriei generale”
Ca răspuns la această cercetare, cercetătorul american Gary Marcus, una dintre vocile sceptice cu privire la adevăratele capacități ale inteligenței artificiale, a numit descoperirile Apple „destul de devastatoare”.
În newsletter-ul său personal Substack, el a declarat: „Oricine crede că modelele lingvistice mari (LLM) sunt o cale directă către AGI se înșeală singur.”
De acord cu această opinie, Andrew Rogoyski, expert la Institutul de Inteligență Artificială Centrată pe Om (Universitatea din Surrey, Marea Britanie), consideră că această constatare indică posibilitatea ca industria tehnologică să se îndrepte spre un „fundături mort”: „Atunci când modelele funcționează bine doar cu probleme simple și de dificultate medie, dar eșuează complet la creșterea dificultății, este clar că există o problemă cu abordarea actuală.”
Un punct anume evidențiat de Apple este lipsa capacității de „raționament general”, adică a capacității de a extinde înțelegerea dintr-o situație specifică la situații similare.
Atunci când cunoștințele nu pot fi transferate așa cum o fac oamenii în mod obișnuit, modelele actuale cad ușor într-o stare de „învățare mecanică”: puternice în modele repetitive, dar slabe în gândire logică sau deducție.
În plus, cercetările au descoperit că modelele de raționament la scară largă consumă resurse de calcul prin efectuarea repetată a pașilor corecți pentru probleme simple, dar alegerea abordării greșite de la bun început pentru probleme puțin mai complexe.
Raportul a testat o serie de modele de top, inclusiv o3 de la OpenAI, Gemini Thinking de la Google, Claude 3.7 Sonnet-Thinking și DeepSeek-R1. Deși Anthropic, Google și DeepSeek nu au răspuns încă, OpenAI a refuzat să comenteze.
Cercetările Apple nu neagă realizările inteligenței artificiale în domeniul limbajului, imaginilor sau big data. Cu toate acestea, evidențiază un punct orb care este trecut cu vederea: capacitatea de a raționa cu sinceritate, care este esențială pentru a atinge o inteligență adevărată.
Sursă: https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html








Comentariu (0)