
השחקן נקמורה אמר שנראה כי גרוק 4 שיחקו במנטליות מתוחה במשחק האחרון - תמונה: צילום מסך
לפני המשחק, OpenAI עוררה סערה כאשר הכריזה על השקת הדור ה-11 של מעבדת LLM, GPT-5.
עם זאת, מודל o3 - ChatGPT ששימש בגמר עדיין הראה יכולות הסקה חזקות, עם שיעור תנועה נכון ממוצע של עד 90.8%, ועבר לחלוטין את 80.2% של Grok 4.
בכל ארבעת המשחקים, ChatGPT לא נתן לגרוק 4 שום סיכוי, והציב את יריבו בשח מט לאחר 35, 30, 28 ו-54 מהלכים בהתאמה.
לפי היקארו נקמורה, המדורג מספר 2 בעולם , נראה היה ש-Grok 4 שיחק עם יותר מתח ועשה יותר טעויות מאשר בסיבובים קודמים. בפרט, הוא איבד בקלות חלקים - מקרה נדיר כאשר ניצח באופן מוחץ את Gemini 2.5 Flash ו-Gemini 2.5 Pro של גוגל.
עם שלושה ניצחונות ברציפות עם תוצאה של 4-0 ושיעור דיוק ממוצע של עד 91%, o3 סיימה את הטורניר בצורה מושלמת.
למרות שלא ניתן להשוות את כוחו של o3 לרב-אמן שחמט מקצועי, הוא מספיק כדי לגרום צרות לשחקנים עם Elo מתחת ל-2,000. במיוחד בקטגוריות בליץ וסופר-בליץ.
הטורניר שאורגן על ידי גוגל הסתיים בניצחון מוחלט של הנציגים האמריקאים. בעוד ששני הדגמים הסיניים, קימי K4 ו-DeepSeek, הודחו מוקדם, את המקום השלישי ניצחה ג'מיני 2.5 פרו מול o4-mini, מה שחיזק את מעמדן של חברות הטכנולוגיה האמריקאיות המובילות.
אירוע זה לא רק מראה את היכולות המדהימות של מודלים של בינה מלאכותית לשימוש כללי בתחום מיוחד. הוא גם פותח פרספקטיבה חדשה על פוטנציאל הפיתוח של בינה מלאכותית בעתיד.
עם זאת, זוהי גם תזכורת לכך שבעוד שתוארי משפטים מתפתחים במהירות, הם עדיין לא יכולים להשתוות לרמתם של מנועי שחמט מקצועיים, שדירוגי ה-Elo שלהם עולים בהרבה על אלו של בני אדם.
מקור: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm






תגובה (0)