מאז התפוצצות גל הבינה המלאכותית, יחידת עיבוד הגרפיקה (GPU) של Nvidia הייתה המוקד הגדול ביותר של עולם הטכנולוגיה בכל הנוגע לתשתיות בינה מלאכותית.
שווי השוק של Nvidia, עלות ההון של ספקי שירותי ענן, או מהירות האימון של חברות פיתוח מודלים - כולם מסתכמים בסופו של דבר במשוואה אחת: מי שיש לו יותר כרטיסי מסך מתקרב יותר להבטחת מקום בסיבוב הבא של מרוץ הבינה המלאכותית.
עם זאת, ב-Computex 2026, הסיפור החדש שסיפר מייסד Nvidia, ג'נסן הואנג, כבר לא סובב אך ורק סביב כרטיסי מסך.
חזרתו של המעבד
Nvidia הכריזה על כניסתה לשוק מעבדי המחשב האישי עם ה-RTX Spark. קו השבבים החדש, שצפוי להיות מושק בסתיו הקרוב, יתחרה ישירות באינטל וב-AMD.
עם זאת, מה שמשך את תשומת ליבו של עולם הטכנולוגיה היה Vera - קו המעבדים הראשון של Nvidia למרכזי נתונים שפותח באופן עצמאי, שהושק רשמית. מר הואנג אף טען שזה יהיה מנוע הצמיחה העיקרי החדש של החברה, שמטרתו שוק מעבדים של 200 מיליארד דולר .
![]() |
Vera – המעבד המותאם אישית הראשון של Nvidia שתוכנן במיוחד לתזמור של בינה מלאכותית של Agentic, קריאות כלים וניהול הקשר לטווח ארוך. צילום: Nvidia. |
הציפיות של מנכ"ל אנבידיה אינן חסרות בסיס. עם התפוצצות סוכני הבינה המלאכותית, החזקת מספר רב של כרטיסי מסך כבר אינה מספיקה.
ל-GPU עדיין תפקיד מרכזי בתהליך הסקת המודל, אך לפני ואחרי כל הסקה, המערכת זקוקה ל-CPU כדי לטפל בתזמון, קריאות לכלי וזרימת נתונים.
זו גם הסיבה שמעבדים (CPUs) הופכים למוקד החדש של תשתית בינה מלאכותית. בשלבים המוקדמים של פריחת היצירתיות של בינה מלאכותית, התמקדה התעשייה כמעט לחלוטין באימון מודלים.
אימון דורש עיבוד סדרה של חישובי מטריצה מקבילים מסיביים - וזהו הכוח המוחלט של מעבדים גרפיים. במקרה זה, המעבד ממלא רק תפקיד תומך כמו אתחול המערכת, העברת נתונים וניהול משימות.
כתוצאה מכך, בשנים האחרונות, אופטימיזציה מלאה של ה-GPU ומזעור ה-CPU הפכו כמעט לקונצנזוס בכל תעשיית הטכנולוגיה.
עם זאת, ככל שהבינה המלאכותית עוברת מאימון מודלים שפה בקנה מידה גדול להסקה בקנה מידה גדול, ונמשכת לעידן הבינה המלאכותית של סוכנים, אופי עומס העבודה מתחיל להשתנות.
סוכני בינה מלאכותית אינם מערכות שאלות ותשובות לינאריות. במקום זאת, הם מפרקים משימה מורכבת למספר שלבים, כולל קריאה לכלי חיצוניים, קריאה וכתיבה למסדי נתונים, ביצוע חיפושים, הרצת קוד, טיפול באימות וניהול אחסון במטמון הקשר.
לאחר מכן המערכת מעריכה האם התוצאה הנוכחית תקפה לפני שהיא מחליטה על הפעולה הבאה. בקשת משתמש בודדת יכולה להפעיל בו זמנית עשרות, ואף מאות, של סוכני משנה הפועלים במקביל.
![]() |
הארכיטקטורה של מעבד Vera. תמונה: Nvidia. |
התיאום, קריאה לכלי, ניהול הזיכרון ושיתוף הפעולה בין סוכני הילדים הללו אינם מבוצעים במידה רבה על ה-GPU.
המעבד הגרפי עדיין יכול להתמודד עם הסקת מודל - הדבר הקרוב ביותר ל"חשיבה". אבל בין הסקות, המעבד חייב לנתח את פלט המודל, להחליט לאיזה כלי לקרוא בהמשך, לנהל את תוכנית הביצוע, לטפל בקריאה וכתיבה של קבצים, ליזום בקשות רשת ולבסוף לספק את התוצאות בחזרה למעבד הגרפי.
השיגעון העולמי הבא
בעבר, תצורת שרת הבינה המלאכותית הסטנדרטית כללה בדרך כלל מעבד אחד בשילוב עם שמונה מהמעבדים הגרפיים העדכניים ביותר. עם זאת, ככל שעומסי עבודה של בינה מלאכותית עוברים מאימון להסקה ולאחר מכן לסוכני בינה מלאכותית, יחס המעבד לכרטיס המסך יורד מ-1:8 ל-1:4, ובעתיד הוא עשוי להגיע ל-1:1 או אף גבוה יותר.
זו גם הסיבה שמנכ"לית AMD, ליסה סו, הדגישה שוב ושוב כי תעשיית הטכנולוגיה בעבר לא העריכה נכון את ערכם של מעבדים בעידן הבינה המלאכותית.
מנקודת מבטה, שוק מרכזי הנתונים לבדו עשוי לעלות על טריליון דולר בגודלו בתוך 3-4 השנים הקרובות. שוק עצום זה דורש דו-קיום של טכנולוגיות מרובות כגון מעבדים, כרטיסי מסך ו-ASIC.
רק לפני 6-12 חודשים, מעבדים כמעט ולא הוזכרו בשוק, ואף אחד לא חשב שהם יהפכו לנדירים. עם זאת, עם העלייה הגוברת בביקוש לכוח מחשוב, מעבדים חזרו רשמית למרכז הבמה.
מנכ"ל AMD צופה כי בחמש השנים הקרובות, קצב הצמיחה השנתי המצטבר של שוק המעבדים של מרכזי הנתונים יעלה על 35%, הרבה מעבר לקצב הצמיחה של פחות מ-10% בשנים קודמות.
במקום להיכנס למלחמת מחירים עם אינטל או AMD, האסטרטגיה האמיתית של Nvidia היא לבטל לחלוטין את המאמץ ממעבדים משופרים, רוחב פס PCIe ורשתות מהירות נמוכה שמעכבות את ביצועי ה-GPU.
![]() |
מנכ"ל Nvidia מחזיק בשני מחשבים ניידים המופעלים על ידי שבבי RTX Spark בכנס Computex 2026, לציון חזרתה של החברה לשוק שבבי ה-PC. צילום: Nvidia . |
ענקית כרטיסי המסך רוצה להפנים את המעבד, מה שהופך אותו להתאמה מושלמת לפלטפורמת הבינה המלאכותית הקניינית שלה כדי להבטיח שה-GPU הטובים ביותר שלה לא ייעצר.
בעקבות כיוון זה, Nvidia השיקה את Vera - המעבד המותאם אישית הראשון שתוכנן במיוחד לתזמור בינה מלאכותית של Agentic, קריאות כלים וניהול הקשר לטווח ארוך.
עם זאת, המציאות היא שהנהנית הגדולה ביותר מהפריחה הזו של ייצור המעבדים היא לא אחרת מאשר אינטל, חברת הענק לשעבר. דוחות כספיים מראים כי הכנסות אינטל ברבעון הראשון של 2026 הגיעו ל-13.6 מיליארד דולר , עלייה של 7% משנה לשנה, בעוד שהרווח הנקי זינק ב-156%.
מנכ"ל אינטל, ליפ-בו טאן, הצהיר כי סדרת המוצרים Xeon 6 (המבוססת על תהליך Intel 3) ו-Core 3 (המבוססת על תהליך Intel 18A) נכנסו שתיהן לשלב האצת הייצור ההמוני.
עם זאת, הוא גם הודה כי אינטל עדיין אינה מסוגלת לעמוד בדרישות השוק באופן מלא וכי מגמת צמיחה זו צפויה להימשך עד 2027.
מקור: https://znews.vn/mo-vang-tiep-theo-cua-nvidia-post1657130.html









