מודל הבינה המלאכותית s1, שנוצר על ידי חוקרים אמריקאים, עולה על פי הדיווחים רק 50 דולר, אך הוא מספק יכולות חשיבה שוות ערך למודל o1 של OpenAI, שעולה הרבה יותר. הופעתו של s1 מגיעה לאחר ההצלחה המרשימה של DeepSeek, שעוררה סערה בעמק הסיליקון בימים האחרונים.
מלחמת "הבינה המלאכותית הזולה" מתחממת מאז הופעתה של DeepSeek
הצוות פרסם את קוד המקור של s1 ב-GitHub, יחד עם הקוד והנתונים ששימשו לבניית המודל. מאמר שפורסם בשבוע שעבר מסביר את תהליך פיתוח המודל, תוך הדגשת הטכניקות החכמות בהן השתמשו. במקום להתחיל מאפס עם מודל חשיבה חדש, הצוות השתמש במודל שפה קיים וביצע תהליך "כוונון עדין" על ידי זיקוק יכולות החשיבה ממודל Gemini 2.0 Flash Thinking Experimental של גוגל.
עלויות תפעול של בינה מלאכותית קצת פחות מ-50 דולר
אימון מודל ה-s1 ארך 30 דקות בלבד, תוך שימוש ב-16 מעבדי גרפיקה מסוג Nvidia H100. למרות שכל כרטיס גרפי עולה כ-25,000 דולר, עלות השכרת התהליך הייתה מתחת ל-50 דולר הודות לשירותי מחשוב ענן. בפרט, הצוות גילה טריק שימושי: הוראה למודל "לחכות" לפני מתן תשובה סופית, מה ששיפר את הנמקתו והביא לפתרונות טובים יותר.
בעוד ש-s1 השיג הישגים משמעותיים בעלות נמוכה, קיימות חששות לגבי יכולת ההרחבה שלו. השימוש במודל של גוגל כ"מורה" מעלה שאלות לגבי יכולתו להתחרות במודלים המובילים של בינה מלאכותית כיום. גוגל צפויה לעקוב מקרוב אחר המצב, במיוחד לאור ההתדיינות המתמשכת בין OpenAI ל-DeepSeek.
[מודעה_2]
מקור: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
תגובה (0)