Denna nya modell utmanar inte bara de amerikanska jättarnas dominans utan omformar också hela spelet med öppen källkod (Illustration: DS).
Modellen har 685 miljarder parametrar och släpps under en öppen källkodslicens. Initiala testresultat visar att dess prestanda är i nivå med proprietära system från OpenAI eller Anthropic, och öppnar upp för ett nytt sätt att utveckla och distribuera avancerade AI-modeller.
Prestanda och kostnad
Kort efter lanseringen på Hugging Face-plattformen fick DeepSeek V3.1 71,6 % på Aider-programmeringstestet. Tekniskt sett kan modellen hantera kontexter på upp till 128 000 tokens (motsvarande en bok på cirka 400 sidor). Arkitekturen introduceras som en "hybrid" som integrerar konversations-, resonemangs- och programmeringsfunktioner.
”DeepSeek V3.1 uppnådde 71,6 % på Aider, ungefär 1 % bättre än Claude Opus 4 samtidigt som det kostade betydligt mindre”, sa AI-forskaren Andrew Christianson på det sociala nätverket X.
Det uppskattas att den genomsnittliga kostnaden för att slutföra en programmeringsuppgift med V3.1 är cirka 1,01 dollar, medan motsvarande system kan kosta närmare 70 dollar.
Vissa community-utvecklare noterade också närvaron av fyra "speciella tokens" i arkitekturen, vilket gör det möjligt för modellen att integrera webbsökning i realtid och hantera komplexa inferensprocesser.
Denna skillnad innebär besparingar på miljontals dollar för företag som hanterar tusentals AI-interaktioner varje dag.
Banbrytande fördelar
Lanseringen av V3.1 kommer bara några veckor efter att OpenAI och Anthropic presenterade nya modeller. Genom att välja en öppen källkodsmetod följer DeepSeek en annan strategi än många amerikanska företag som kommersialiserar AI-modeller via betalda API:er.
Vissa menar att att göra avancerade funktioner allmänt tillgängliga skulle kunna göra det möjligt för organisationer och företag att driftsätta dem snabbare, samtidigt som det utmanar affärsmodeller baserade på teknikmonopol.
Framväxten av DeepSeek V3.1 visar att avancerad AI inte bara är en domän för stora företag, utan även för mindre forskargrupper.
Konkurrensen inom detta område är inte längre begränsad till att bygga det kraftfullaste systemet, utan kretsar också kring att göra tekniken tillgänglig och prisvärd.
I det sammanhanget är frågan för teknikföretag hur de ska bibehålla kommersiellt värde när fler och fler modeller med öppen källkod med konkurrenskraftig prestanda och kostnad dyker upp.
Källa: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Kommentar (0)