การถกเถียงเรื่องชื่อ AI อันดับต้นๆ ของโลกใน DeepSeek

บริษัทชื่อดังในสาขาปัญญาประดิษฐ์ (AI) ต่างยอมรับความสำเร็จของบริษัทสตาร์ทอัพจีน DeepSeek แต่ระบุว่าความสำเร็จของบริษัทไม่ควรเกินจริง

ตั้งแต่ CEO ของ OpenAI อย่าง Sam Altman ไปจนถึง นักวิทยาศาสตร์ ของ Google อย่าง Andrew Ng จิตใจด้าน AI ที่ชาญฉลาดที่สุดในโลกต่างชื่นชมแนวทางโอเพนซอร์สของ DeepSeek หลังจากที่สตาร์ทอัพจีนรายนี้เปิดตัวโมเดล AI ล้ำสมัยสองโมเดล

บริษัทที่มีฐานอยู่ในเมืองหางโจวสร้างความประหลาดใจให้กับอุตสาหกรรม AI ทั่วโลกด้วยโมเดลการใช้เหตุผลโอเพนซอร์ส R1

โมเดลดังกล่าวซึ่งเปิดตัวเมื่อวันที่ 20 มกราคม แสดงให้เห็นประสิทธิภาพที่เทียบเคียงได้กับโมเดลแบบปิดจาก OpenAI ซึ่งเป็นผู้พัฒนา ChatGPT แต่มีต้นทุนในการฝึกอบรมที่ต่ำกว่ามาก

ดีพซีค ดับเบิลยูเอสเจ — แชทบอท AI ที่พัฒนาโดย DeepSeek ได้รับการดาวน์โหลดหลายล้านครั้งทั่วโลก ภาพ: WSJ

DeepSeek V3 ซึ่งเป็นโมเดลภาษาพื้นฐานขนาดใหญ่ ได้รับการเปิดตัวเมื่อไม่กี่สัปดาห์ที่ผ่านมา และมีค่าใช้จ่ายในการฝึกอบรมเพียง 5.5 ล้านดอลลาร์เท่านั้น ตามที่ DeepSeek ระบุ

การประกาศของบริษัททำให้เกิดคำถามว่าบริษัทเทคโนโลยีกำลังใช้จ่ายเกินตัวสำหรับชิปกราฟิก (GPU) สำหรับการฝึกอบรม AI หรือไม่ ซึ่งนำไปสู่การเทขายหุ้นเทคโนโลยีที่เกี่ยวข้อง

สัปดาห์ที่แล้ว ในกระทู้ "ถามฉันอะไรก็ได้" บน Reddit อัลท์แมนโต้แย้งว่า OpenAI ผิด และจำเป็นต้องหาวิธีอื่นในโอเพนซอร์ส

บริษัทมีแนวทางแบบปิดมาโดยตลอด โดยรักษารายละเอียดต่างๆ เช่น วิธีการฝึกอบรมที่เฉพาะเจาะจงและต้นทุนพลังงานของโมเดลต่างๆ ไว้เป็นความลับ

“ถึงกระนั้น ไม่ใช่ทุกคนที่ OpenAI จะเห็นพ้องต้องกันในมุมมองนี้” และ “มันไม่ใช่สิ่งที่เราให้ความสำคัญสูงสุดในขณะนี้” ซีอีโอของ OpenAI ยอมรับ

Andrew Ng ผู้ก่อตั้ง Google Brain และอดีตหัวหน้านักวิทยาศาสตร์ของ Baidu กล่าวว่าผลิตภัณฑ์จาก DeepSeek และบริษัทในเครือแสดงให้เห็นว่าจีนกำลังไล่ตามทันสหรัฐฯ ในด้าน AI อย่างรวดเร็ว

“เมื่อ ChatGPT เปิดตัวในเดือนพฤศจิกายน 2022 สหรัฐอเมริกามีความก้าวหน้ากว่าจีนอย่างมากในด้าน AI เชิงสร้างสรรค์… แต่ในความเป็นจริง ช่องว่างนั้นได้ลดลงอย่างรวดเร็วในช่วงสองปีที่ผ่านมา” เขาเขียนไว้ใน X “ด้วยโมเดลจากจีนอย่าง Qwen, Kimi, InternVL และ DeepSeek จีนกำลังลดช่องว่างลงอย่างชัดเจน และในด้านต่างๆ เช่น การสร้าง วิดีโอ ก็มีบางครั้งที่จีนดูเหมือนจะก้าวหน้ากว่า”

โมเดล Qwen ได้รับการพัฒนาโดย Alibaba ในขณะที่ Kimi และ InternVL เป็นผลิตภัณฑ์ของบริษัทสตาร์ทอัพ Moonshot AI และ Shanghai AI Lab

หากสหรัฐฯ ยังคงบล็อกโอเพนซอร์ส จีนจะเข้ามาครอบงำส่วนหนึ่งของห่วงโซ่อุปทานนี้ และในที่สุด ธุรกิจหลายแห่งก็จะนำเอาโมเดลที่สะท้อนถึงค่านิยมของจีนมากกว่าค่านิยมของอเมริกามาใช้ ตามที่นาย Ng กล่าว

บริษัทในสหรัฐอเมริกาหลายแห่งกำลังมองหาการนำโมเดลของ DeepSeek มาใช้กับผลิตภัณฑ์ของตน ยกตัวอย่างเช่น ผู้ใช้บริการ NIM ของ Nvidia สามารถเข้าถึงโมเดล R1 ได้ตั้งแต่สัปดาห์ที่แล้ว ขณะที่ Microsoft ก็รองรับ R1 บนคลาวด์ Azure และ GitHub เช่นกัน Amazon อนุญาตให้ลูกค้าสร้างแอปพลิเคชันโดยใช้ R1 ผ่าน AWS

อย่างไรก็ตาม ผู้เชี่ยวชาญบางคนเชื่อว่าความสำเร็จของ DeepSeek ไม่ควรเกินจริง Yann LeCun หัวหน้านักวิทยาศาสตร์ด้าน AI ของ Meta กล่าวว่าแนวคิดที่ว่า "จีนจะแซงหน้าสหรัฐอเมริกาในด้าน AI" เพราะ DeepSeek นั้นไม่ถูกต้อง

“โมเดลโอเพนซอร์สกำลังก้าวล้ำหน้าโมเดลที่เป็นกรรมสิทธิ์” เขาเขียนบน Threads

DeepSeek ซึ่งเป็นบริษัทสตาร์ทอัพที่แยกตัวออกมาจากกองทุนป้องกันความเสี่ยง High-Flyer ของผู้ก่อตั้ง Liang Wenfeng ในเดือนพฤษภาคม 2023 ยังคงเผชิญกับความกังขาเกี่ยวกับต้นทุนที่แท้จริงและวิธีการฝึกอบรมโมเดล AI

ศาสตราจารย์เจิ้งเสี่ยวชิง ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์จากมหาวิทยาลัยฟู่ตัน ชี้ให้เห็นว่าค่าใช้จ่ายในการฝึกอบรม DeepSeek V3 ไม่รวมค่าใช้จ่ายที่เกี่ยวข้องกับการทดสอบและการวิจัย ตามรายงานทางเทคนิคของบริษัทสตาร์ทอัพ

ความสำเร็จของ DeepSeek มาจาก "การเพิ่มประสิทธิภาพทางเทคนิค" เขากล่าว ดังนั้นจึงไม่มีผลกระทบสำคัญต่อการจัดซื้อหรือการจัดส่งชิป

(ตามข้อมูลของ SCMP)

ที่มา: https://vietnamnet.vn/nhung-ten-tuoi-ai-hang-dau-the-gioi-tranh-luan-ve-deepseek-2368357.html