השחקן נקמורה אמר שנראה כי גרוק 4 שיחקו במנטליות מתוחה במשחק האחרון - תמונה: צילום מסך
לפני המשחק, OpenAI עוררה סערה כאשר הכריזה על השקת הדור ה-11 שלה לתואר שני, GPT-5.
עם זאת, מודל o3 - ChatGPT ששימש בגמר עדיין הראה יכולת חשיבה חזקה, עם שיעור מהלך נכון ממוצע של עד 90.8%, ועבר לחלוטין את 80.2% של Grok 4.
בכל ארבעת המשחקים, ChatGPT לא נתן לגרוק 4 שום סיכוי, והציב את יריבו בשח מט לאחר 35, 30, 28 ו-54 מהלכים בהתאמה.
לפי היקארו נקמורה, המדורג מספר 2 בעולם , נראה היה ש-Grok 4 שיחק עם יותר מתח ועשה יותר טעויות מאשר בסיבובים קודמים. בפרט, הוא איבד בקלות חלקים - מקרה נדיר כאשר ניצח באופן מוחץ את Gemini 2.5 Flash ו-Gemini 2.5 Pro של גוגל.
עם שלושה ניצחונות ברציפות עם תוצאה של 4-0 ושיעור דיוק ממוצע של עד 91%, o3 סיימה את הטורניר בצורה מושלמת.
למרות שלא ניתן להשוות את כוחו של o3 לרב-אמן מקצועי בשחמט, הוא מספיק כדי לגרום קשיים לשחקנים עם Elo מתחת ל-2,000. במיוחד בקטגוריות של בליץ וסופר-בליץ.
הטורניר שאורגן על ידי גוגל הסתיים בדומיננטיות מוחלטת של הנציגים האמריקאים. בעוד ששני הדגמים הסיניים, Kimi K4 ו-DeepSeek, הודחו מוקדם, בקרב על המקום השלישי ניצח את Gemini 2.5 Pro על o4-mini, ובכך חיזק את מעמדן של חברות הטכנולוגיה האמריקאיות המובילות.
אירוע זה לא רק מראה את היכולות המדהימות של מודלים של בינה מלאכותית לשימוש כללי בתחום מיוחד. הוא גם פותח פרספקטיבה חדשה על פוטנציאל הפיתוח של בינה מלאכותית בעתיד.
עם זאת, זוהי גם תזכורת לכך שבעוד שתוארי משפטים מתפתחים במהירות, הם עדיין לא יכולים להשתוות לרמתם של מנועי שחמט מקצועיים, שדירוגי ה-Elo שלהם עולים בהרבה על אלו של בני אדם.
מקור: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
תגובה (0)