DeepSeek לא יכולה ליצור בינה מלאכותית המקבילה ל-OpenAI עם 5 מיליון דולר.

DeepSeek, הסטארט-אפ הסיני הלוהט ביותר בימים האחרונים, העלה ספקות לגבי טענתו כי יצרה בינה מלאכותית ברמה של OpenAI עם 5 מיליון דולר בלבד.

DeepSeek זכתה לסיקור תקשורתי נרחב וסיקור מדיה חברתית בתחילת שנת הנחש, וגרמה לרעידות משמעותיות בשוקי המניות העולמיים.

עם זאת, דו"ח שפורסם לאחרונה על ידי חברת הייעוץ הפיננסי ברנשטיין מזהיר כי למרות הישגים מרשימים, הטענה בדבר יצירת מערכת בינה מלאכותית דומה לזו של OpenAI תמורת 5 מיליון דולר בלבד אינה מדויקת.

לדברי ברנשטיין, הצהרתה של DeepSeek מטעה ואינה משקפת את התמונה הגדולה.

"אנו מאמינים ש-DeepSeek לא 'יצרנו את OpenAI עם 5 מיליון דולר'; המודלים פנטסטיים אבל אנחנו לא חושבים שהם ניסים; ונראה שהבהלה בסוף השבוע הייתה מוגזמת", נכתב בדו"ח.

דיפסיק בלומברג — אנליסטים של ברנשטיין סקפטיים לגבי טענתה של DeepSeek לפיתוח מערכת בינה מלאכותית תמורת 5 מיליון דולר בלבד. (תמונה: בלומברג)

DeepSeek מפתחת שני מודלים עיקריים של בינה מלאכותית: DeepSeek-V3 ו-DeepSeek R1. מודל שפת V3 בקנה מידה גדול ממנף את ארכיטקטורת MOE, ומשלב מודלים קטנים יותר כדי להשיג ביצועים גבוהים תוך שימוש בפחות משאבי מחשוב בהשוואה למודלים מסורתיים.

מצד שני, לדגם V3 יש 671 מיליארד פרמטרים, כאשר 37 מיליארד פרמטרים פעילים בכל זמן נתון, תוך שילוב חידושים כמו MHLA להפחתת השימוש בזיכרון וניצול FP8 ליעילות רבה יותר.

אימון מודל V3 דרש אשכול של 2,048 כרטיסי מסך של Nvidia H800 במשך חודשיים, שווה ערך ל-5.5 מיליון שעות GPU. בעוד שחלק מההערכות מעריכות את עלות האימון בכ-5 מיליון דולר, הדו"ח של ברנשטיין מדגיש כי נתון זה מכסה רק משאבי מחשוב ואינו מתחשב בעלויות משמעותיות הקשורות למחקר, בדיקות והוצאות פיתוח אחרות.

מודל DeepSeek R1 בונה על היסודות של V3 על ידי שימוש בלמידת חיזוק (RL) וטכניקות אחרות כדי להבטיח יכולת הסקה.

מודל R1 יכול להתחרות במודלים של OpenAI במשימות חשיבה. עם זאת, ברנשטיין מציין כי פיתוח R1 דורש משאבים משמעותיים, אם כי אלה אינם מפורטים בדוח של DeepSeek.

בתגובה ל-DeepSeek, ברנשטיין שיבח את המודלים כמרשימים. לדוגמה, מודל V3 מתפקד באותה מידה או טוב יותר ממודלי שפה מרכזיים אחרים בבלשנות, תכנות ומתמטיקה, תוך שהוא דורש פחות משאבים.

תהליך אימון מקדים של V3 דרש רק 2.7 מיליון שעות עבודה של GPU, או 9% ממשאבי המחשוב של דגמים מובילים אחרים.

ברנשטיין סיכם כי בעוד שההתקדמות של DeepSeek ראויה לציון, יש להיזהר מטענות מוגזמות. הרעיון של יצירת מתחרה ל-OpenAI עם 5 מיליון דולר בלבד נראה שגוי.

(על פי טיימס אוף אינדיה)

[מודעה_2]
מקור: https://vietnamnet.vn/deepseek-khong-the-lam-ai-tuong-duong-openai-voi-5-trieu-usd-2367340.html