Vietnam.vn - Nền tảng quảng bá Việt Nam

Varování před „halucinogenním“ ChatGPT

Nedávné studie ukázaly, že GPT o3 a o4-mini – nejvýkonnější modely v produktovém portfoliu OpenAI – vymýšlejí ještě více falešných informací než jejich předchůdci.

ZNewsZNews20/04/2025

Dva nově uvedené modely ChatGPT mají vyšší frekvenci vykonstruovaných informací než předchozí generace. Foto: Fireflies .

Pouhé dva dny po oznámení GPT-4.1 společnost OpenAI oficiálně uvedla na trh ne jeden, ale hned dva nové modely s názvem o3 a o4-mini. Oba modely demonstrují vynikající schopnosti uvažování s mnoha výkonnými vylepšeními.

Podle serveru TechCrunch však tyto dva nové modely stále trpí „halucinacemi“ neboli sebevynalézavostí. Ve skutečnosti vykazují více halucinací než některé starší modely OpenAI.

Podle IBM jsou halucinace jevy, kdy velké jazykové modely (LLM) – často chatboti nebo nástroje počítačového vidění – přijímají datové vzory, které neexistují nebo jsou pro člověka nerozpoznatelné, a tím produkují bezvýznamné nebo nepřesné výsledky.

Jinými slovy, uživatelé často očekávají, že umělá inteligence bude na základě trénovaných dat produkovat přesné výsledky. V některých případech však výsledky umělé inteligence nejsou založeny na přesných datech, což vede k „falešné“ odpovědi.

Ve své nejnovější zprávě OpenAI zjistila, že o3 byla „iluzorní“ při zodpovězení 33 % otázek na PersonQA, interním standardu společnosti pro měření přesnosti znalostí modelu o lidech.

Pro srovnání, toto číslo je dvojnásobné oproti mírě „iluze“ u předchozích modelů uvažování OpenAI, o1 a o3-mini, které činily 16 %, respektive 14,8 %. Model O4-mini si na PersonQA vedl ještě hůře a „iluze“ se projevovala po 48 % doby trvání testu.

Ještě znepokojivější je, že „otec ChatGPT“ ve skutečnosti neví, proč se to děje. Konkrétně ve své technické zprávě o o3 a o4-mini OpenAI uvádí, že „je zapotřebí dalšího výzkumu, abychom pochopili, proč se ‚halucinace‘ zhoršují“ při škálování modelů uvažování.

Modely O3 a o4-mini dosahují lepších výsledků v některých oblastech, včetně programování a matematických úkolů. Protože však musí „vytvářet více než obecných tvrzení“, oba modely vedly k „přesnějším, ale také méně přesným tvrzením“.

Zdroj: https://znews.vn/canh-bao-ve-chatgpt-ao-giac-post1547242.html


Komentář (0)

Zanechte komentář a podělte se o své pocity!

Dědictví

Postava

Firmy

Aktuální události

Politický systém

Místní

Produkt

Happy Vietnam
Muzeum

Muzeum

Nuance postav v tradiční vietnamské opeře.

Nuance postav v tradiční vietnamské opeře.

Východ slunce nad poli

Východ slunce nad poli