גוגל משיקה את ג'מיני 2.5 - דור חדש של מודלים לחשיבה בבינה מלאכותית

את הדור החדש מובילה חברת Gemini 2.5 Pro Experimental, מודל בינה מלאכותית רב-מודאלית עם מה שהחברה טוענת כיכולת החשיבה החכמה ביותר שלה עד כה. הוא יהיה זמין החל מהיום, 26 במרץ, בפלטפורמת המפתחים של Google AI Studio, וכן באפליקציית Gemini למנויי Gemini Advanced (20 דולר לחודש).

לתאומים 2.5 יש את היכולת "לעצור לחשוב" לפני מתן תשובה. (צילום: גוגל)

חשיבה על בינה מלאכותית – הכיוון החדש של גוגל

גוגל הודיעה שמעתה ואילך, כל דגמי הבינה המלאכותית החדשים שלה יכללו יכולות חשיבה מובנות.

מאז ש-OpenAI הציגה את o1, מודל הבינה המלאכותית החושבת הראשון, בספטמבר 2024, תעשיית הטכנולוגיה מתחרה כדי להתאים או להתעלות על יכולותיה. ל-Anthropic, DeepSeek, Google ו-xAI יש כעת מודלים של בינה מלאכותית חשיבה המשתמשים בכוח מחשוב נוסף כדי לבחון מידע ולנתח בעיות לפני שהם מגיעים לפתרון.

התקדמות בבינה מלאכותית קוגניטיבית אפשרה למודלים להתעלות על מתמטיקה ותכנות. טכנולוגים רבים מאמינים שזה יהיה בסיס חשוב לסוכני בינה מלאכותית - מערכות אוטומטיות שיכולות לבצע משימות ללא התערבות אנושית. עם זאת, בינה מלאכותית קוגניטיבית גם צורכת יותר משאבים, מה שמוביל לעלויות תפעול גבוהות יותר.

גוגל ערכה בעבר ניסויים בחשיבה על בינה מלאכותית עם גרסה מיוחדת של ג'מיני בדצמבר 2024. אבל ג'מיני 2.5 הוא המהלך הרציני ביותר של החברה עד כה שמתחרה בסדרת "o" של OpenAI.

ביצועים יוצאי דופן במספר קריטריונים

ה-Gemini 2.5 Pro מנצח מתחרים מובילים רבים במספר מבחנים. (צילום: גוגל)

גוגל טוענת שדגם Gemini 2.5 Pro לא רק עולה בביצועיו על דגמי הבינה המלאכותית הקודמים שלו, אלא גם גובר על מתחרים מובילים רבים במספר מבחנים.

במבחן Aider Polyglot, המודד את היכולת לערוך קוד תכנות, ה-Gemini 2.5 Pro קיבל ציון של 68.6%, ועבר את הדגמים המובילים מבית OpenAI, Anthropic ו-DeepSeek.

עם זאת, במבחן SWE-bench Verified של יכולות פיתוח תוכנה, ה-Gemini 2.5 Pro קיבל ציון של 63.8%, שהוא גבוה יותר מה-OpenAI o3-mini וה-DeepSeek R1, אך עדיין נמוך יותר מה-Claude 3.7 Sonnet של Anthropic (70.3%).

במבחן הרב-תחומי "בחינת האנושות האחרונה", הכולל אלפי שאלות בתחומי המתמטיקה, מדעי החברה ומדעי הטבע, ה-Gemini 2.5 Pro קיבל ציון של 18.8%, גבוה יותר מרוב דגמי הבינה המלאכותית המובילים האחרים.

ראוי לציין כי ה-Gemini 2.5 Pro יכול לעבד מיליון טוקנים בו זמנית, שווה ערך לכ-750,000 מילים - יותר מכל סדרת ספרי שר הטבעות. גוגל חשפה גם כי בעתיד הקרוב, דגם זה יתמוך בעד 2 מיליון טוקנים, מה שיגדיל משמעותית את היכולת לנתח ולזכור הקשרים ארוכים.

גוגל טרם חשפה את תמחור ה-API עבור Gemini 2.5 Pro. החברה מסרה כי תספק מידע נוסף בשבועות הקרובים.

Khanh Huyen (מקור: Tech Crunch)

מקור: https://vtcnews.vn/google-ra-mat-gemini-2-5-the-he-mo-hinh-ai-tu-duy-moi-ar933854.html