Model umělé inteligence (AI) s1, který vytvořili američtí vědci, má údajně provozní náklady pouhých 50 USD, ale poskytuje logické uvažování ekvivalentní modelu o1 od OpenAI, který stojí mnohem více. Vznik s1 přichází po působivém úspěchu DeepSeek, který v posledních dnech vyvolal v Silicon Valley rozruch.
Válka „levné umělé inteligence“ se od objevení DeepSeeku vyostřuje.
Tým zveřejnil zdrojový kód s1 na GitHubu spolu s kódem a daty použitými k vytvoření modelu. Článek publikovaný minulý týden vysvětluje proces vývoje modelu a zdůrazňuje chytré techniky, které použili. Místo toho, aby tým začínal od nuly s novým modelem uvažování, použil existující jazykový model a provedl proces „jemného doladění“ destilací schopností uvažování z experimentálního modelu Google Gemini 2.0 Flash Thinking.
Provozní náklady umělé inteligence těsně pod 50 dolary
Trénování modelu s1 trvalo pouhých 30 minut s použitím 16 grafických procesorů Nvidia H100. Přestože každý grafický procesor stojí kolem 25 000 dolarů, náklady na pronájem celého procesu se díky cloudovým službám pohybovaly pod 50 dolary. Tým objevil zejména užitečný trik: instrukci modelu, aby „čekal“, než poskytne konečnou odpověď, což zlepšilo jeho uvažování a vedlo k lepším řešením.
Přestože s1 dosáhl významného zisku za nízkou cenu, existují obavy ohledně jeho škálovatelnosti. Použití modelu Googlu jako „učitele“ vyvolává otázky ohledně jeho schopnosti konkurovat dnešním předním modelům umělé inteligence. Google bude situaci pravděpodobně bedlivě sledovat, zejména vzhledem k probíhajícímu soudnímu sporu mezi OpenAI a DeepSeek.
Zdroj: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Komentář (0)