דיפסיק הודח מכיסאו.

Qwen3, טכנולוגיה חדשה שהושקה על ידי עליבאבא. צילום: SCMP .

על פי מבחני הבינה המלאכותית האחרונים, מודל הבינה המלאכותית Qwen3 החדש של עליבאבא עקף את R1 של DeepSeek והפך למודל הקוד הפתוח בעל הדירוג הגבוה ביותר בעולם .

באופן ספציפי, נתונים מ-LiveBench, פלטפורמה עצמאית שמדרגת מודלים של שפה גדולה (LLMs), הטכנולוגיה הבסיסית לשירותי בינה מלאכותית גנרטיביים כמו ChatGPT, מראים ש-Qwen3 עקפה את R1 במבחנים.

הערכת היכולות של מודלים של בינה מלאכותית בקוד פתוח כוללת תכנות, מתמטיקה, ניתוח נתונים והוראת שפות.

עליבאבא הוציאה את סדרת דגמי הבינה המלאכותית Qwen3 שלה ב-28 באפריל. החברה טוענת כי צ'אטבוט זה יכול להתחרות, או אפילו לעקוף, את הדגמים הנוכחיים הטובים ביותר של OpenAI או גוגל במקרים מסוימים.

עם גודל של עד 235 מיליארד פרמטרים, ל-Qwen3 ביצועים דומים ל-DeepSeek-V2 ול-OpenAI GPT-4, שיש להם כ-236 מיליארד ו-175 מיליארד פרמטרים בהתאמה. בקרוב יוכלו המשתמשים להוריד אותו תחת רישיון פתוח בפלטפורמת פיתוח הבינה המלאכותית Hugging Face ו-Github לאחר שסדרת דגמים זו תצא לאור.

החברה הצהירה כי קולקציית Qwen3 כוללת מודלים היברידיים, כלומר הם יכולים להקצות זמן באופן גמיש לחשיבה כדי לפתור בעיות מורכבות או להגיב במהירות לבקשות פשוטות. במודל זה, יכולת החשיבה מאפשרת אימות עצמי של דיוק המידע, אך הדבר מגיע עם פער זמן משמעותי.

עיצוב זה מאפשר למשתמשים להקצות בקלות תקציב כראוי לכל משימה ספציפית. יתר על כן, מודל זה גם לומד ממתחרים רבים ברחבי העולם.

באמצעות ארכיטקטורת "תערובת מומחים" (MoE) בדומה ל-DeepSeek, Qwen3 יכולה לייעל את ביצועי החישוב תוך שימוש רק בחלקיק מעלות האימון. שיטה זו מפרקת משימות לחלקים נפרדים רבים ודורשת רק כמות מספקת של נתונים עתירי נתונים כדי לבצע אותן.

על פי צוות הפיתוח, Qwen3 תומך בעד 119 שפות ומאומן על מערך נתונים של כמעט 36 טריליון טוקנים, השווה ערך ל-27 טריליון מילים. נתוני האימון מגיעים ממקורות שונים כגון ספרי לימוד, ערכות שאלות-תשובות, קוד תכנות, או אפילו נתונים שנוצרו על ידי בינה מלאכותית וכו'.

למרות ש-Qwen3 נמצא בראש דירוג הקוד הפתוח, מבחן הביצועים המורחב של LiveBench מראה ש-Qwen3 עדיין מפגר אחרי דגמי הבינה המלאכותית המובילים בעולם בקוד סגור. הבולטים שבהם הם o3 של OpenAI, Gemini Pro 2.5 של גוגל ו-Claude 3.7 של Anthropic.

נכון לעכשיו, מודל OpenAI המתקדם ביותר הנתמך על ידי מיקרוסופט, o3-mini high, עומד בראש הדירוג הכללי של מודלי בינה מלאכותית ברחבי העולם.

מקור: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html