Vietnam.vn - Nền tảng quảng bá Việt Nam

Speciální setkání, kde se matematici snaží porazit umělou inteligenci

Přední světoví matematici se tajně setkali, aby našli způsob, jak porazit umělou inteligenci (AI), ale byli jejími schopnostmi ohromeni.

VietnamPlusVietnamPlus20/05/2025

Jednoho víkendu v polovině května se konala tajná schůzka světa matematiky. 30 předních světových matematiků tajně odcestovalo do Berkeley v Kalifornii v USA, aby se zúčastnilo konfrontace s chatbotem schopným „uvažovat“. Chatbot měl za úkol řešit problémy napsané samotnými matematiky, aby se otestovaly jeho schopnosti řešit problémy.

Po dvou dnech nepřetržitého kladení otázek na úrovni profesora byli matematici překvapeni, když si uvědomili, že tento chatbot dokáže vyřešit některé z nejobtížnějších problémů, jaké kdy byly v historii vyřešeny.

„Viděl jsem kolegy, kteří přímo říkali, že tento rozsáhlý jazykový model se blíží úrovni matematického génia,“ řekl časopisu Scientific American Ken Ono, profesor na Virginské univerzitě a předseda a porotce setkání.

Chatbot, který upoutal naši pozornost, je poháněn platformou o4-mini , což je model velkého jazyka (LLM) určený pro komplexní uvažování. Je produktem OpenAI a je trénován k provádění sofistikovaného uvažování. Ekvivalentní model od Googlu, Gemini 2.5 Flash, má podobné funkce.

Stejně jako předchozí modely ChatGPT LLM se i o4-mini učí předpovídat další slovo v textovém řetězci. O4-mini je však lehčí a flexibilnější verze trénovaná na hlubokých datech a pečlivě vyladěná lidmi – což jí umožňuje ponořit se do matematických problémů, kam se předchozí modely nedokázaly dostat.

Aby otestovala schopnosti o4-mini, požádala OpenAI neziskovou organizaci Epoch AI, která se specializuje na testování modelů LLM, o vytvoření 300 dříve nepublikovaných matematických otázek. Zatímco tradiční LLM dokáží řešit mnoho složitých problémů, při kladení zcela nových otázek většina z nich odpověděla méně než 2 % správně, což naznačuje, že nebyli skutečně schopni uvažovat.

V novém evaluačním projektu společnost Epoch AI najala mladého matematika Dr. Elliota Glazera jako svého vedoucího. Nový projekt s názvem FrontierMath bude nasazen od září 2024.

Projekt shromažďuje nové otázky na čtyřech úrovních obtížnosti, od bakalářské, magisterské až po pokročilý výzkum. Do dubna 2025 Glazer zjistil, že o4-mini dokáže vyřešit asi 20 % problémů. Přešel tedy až na úroveň 4 – požádal ho o řešení problémů, se kterými by se potýkali i pokročilí matematici.

Účastníci byli nuceni podepsat dohodu o mlčenlivosti a mohli komunikovat pouze prostřednictvím šifrované aplikace Signal, protože používání e-mailu mohlo LLM umožnit skenovat a „vyčuchávat“ obsah, a tím zfalšovat vyhodnocovací data.

Každý problém, který o4-mini nedokáže vyřešit, přinese tazateli odměnu ve výši 7 500 USD.

Původní tým dělal pomalý, ale stabilní pokrok v tvorbě otázek. Glazer se však rozhodl věci urychlit uspořádáním osobní schůzky ve dnech 17. a 18. května. 30 zúčastněných matematiků bylo rozděleno do skupin po šesti, které mezi sebou soupeřily – ne v řešení problémů, ale v přicházení s problémy, které umělá inteligence vyřešit nedokázala.

Večer 17. května začal být Ken Ono frustrovaný chatbotem, který vykazoval úroveň matematických znalostí daleko za očekávanou, což týmu ztěžovalo jeho „chytání do pasti“. „Přišel jsem s problémem, který by odborníci v oboru rozpoznali jako otevřený problém v teorii čísel – problém vhodný pro doktorát,“ řekl.

Když se tedy zeptal o4-mini, byl ohromen, když viděl, jak chatbot analyzuje, uvažuje a přichází se správným řešením za pouhých 10 minut. Konkrétně se během prvních dvou minut naučil a pochopil všechny relevantní dokumenty. Poté navrhl vyzkoušet jednodušší verzi problému, aby se naučil, jak k němu přistupovat.

O pět minut později chatbot odpověděl správnou odpověď sebevědomým – až arogantním – tónem. „Začal být drzý,“ říká Ono, „a dodal: ‚Není třeba citovat, protože jsem přišla na tajné číslo!‘“

Poté, co ho umělá inteligence brzy ráno 18. května porazil, Ono okamžitě poslal týmu varovnou zprávu prostřednictvím Signalu. „Nebyl jsem na takový model vůbec připravený,“ řekl. „Nikdy jsem v počítačovém modelu neviděl takový druh uvažování. Bylo to myšlení, jaké by myslel skutečný vědec . A to bylo děsivé.“

Přestože se matematikům konečně podařilo najít 10 otázek, které o4-mini zarazily, stále nedokázali skrýt svůj šok z rychlosti vývoje umělé inteligence za pouhý jeden rok.

Ono přirovnává zkušenosti ze spolupráce s o4-mini ke spolupráci s velmi talentovaným kolegou. A Yang Hui He, matematik z Londýnského institutu matematických věd a průkopník v aplikaci umělé inteligence v matematice, k tomu říká: „Tohle dokáže velmi, velmi talentovaný doktorand – a ještě víc.“

A je třeba poznamenat, že umělá inteligence to zvládne mnohem rychleji než lidé. Zatímco lidem trvá vyřešení týdny nebo měsíce, o4-mini to trvá jen několik minut.

Nadšení kolem o4-mini není bez obav. Ono i He varují, že schopnosti o4-mini mohou lidi vést k přehnané sebedůvěře. „Máme důkaz indukcí, důkaz sporem a nyní i důkaz… ohromujícím způsobem,“ říká He. „Pokud něco řeknete s dostatečnou jistotou, lidé se zastraší. Myslím, že o4-mini tento druh důkazu zvládl: říká všechno s velkou jistotou.“

Na konci schůze začali matematici přemýšlet o budoucnosti matematiky. Diskutovali o možnosti „páté úrovně“ – otázek, které nedokážou vyřešit ani ti nejlepší matematici na světě. Pokud umělá inteligence dosáhne této hranice, role matematiků se dramaticky změní: možná se stanou tazateli, kteří budou s umělou inteligencí interagovat a vést její uvažování k objevování nových matematických pravd – podobně jako profesor pracuje s postgraduálním studentem.

„Už dlouho svým kolegům říkám, že by byla obrovská chyba si myslet, že obecná umělá inteligence nikdy nevznikne, že je to jen počítač,“ řekl Ono. „Nechci panikařit, ale v některých ohledech tyto velké jazykové modely již začínají překonávat většinu nejlepších doktorandů na světě.“

(Vietnam+)

Zdroj: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp


Komentář (0)

No data
No data

Ve stejné kategorii

Snaha o zachování tradičního řemesla výroby hraček pro podzimní období ve vesnici Ong Hao
Ztraceni při lovu v oblaku v Ta Xua
Obdivování pobřežních větrných elektráren Gia Lai skrytých v oblacích
Kavárny v Hanoji hemží výzdobou pro festival středu podzimu a lákají mnoho mladých lidí, aby si ji užili.

Od stejného autora

Dědictví

Postava

Obchod

No videos available

Zprávy

Politický systém

Místní

Produkt