באירוע הטכנולוגיה העולמי Computex 2026 שנערך בטאיפיי, טייוואן, מוקד הדיונים בתעשיות המוליכים למחצה והמחשוב עבר באופן משמעותי מ"בינה מלאכותית בענן" ל"בינה מלאכותית בקצה". תעשיית החומרה עוברת ארגון מחדש כאשר כוח מחשוב ברמת מרכז הנתונים משולב במכשירים אישיים המוצבים ישירות בסביבת העבודה.
המעבר מבינה מלאכותית רספונסיבית לסוכנים אוטונומיים (סוכן בינה מלאכותית)
בשלבים המוקדמים של גל הבינה המלאכותית, תהליך התפעול הנפוץ כלל הגשת בקשות נתונים על ידי משתמשים לשרתי ענן כמו OpenAI, גוגל או מיקרוסופט וקבלת תשובות. עם זאת, ארכיטקטורה זו חשפה מגבלות רבות בנוגע להשהיית השידור, עלויות רוחב פס ואבטחת נתוני המקור.

Nvidia DGX Spark היא סדרת מחשבים אישיים שתוכננה במיוחד עבור בינה מלאכותית ותופץ בווייטנאם.
תמונה: אן קוואן
פיתוח הבינה המלאכותית האגנטית - דור של סוכני תוכנה אוטונומיים המסוגלים לתכנן, להסיק ולקיים אינטראקציה ישירה עם מערכות קבצים מקומיות - מציב דרישות חדשות לתשתית החומרה. במקום להגיב באופן פסיבי, סוכנים אלה פועלים כמשאבי אנוש דיגיטליים, ומעבדים זרם רציף של מידע בזמן אמת. כדי להבטיח שלמות ואבטחת נתונים, הפעלה לא מקוונת של מודלים של בינה מלאכותית במכשירי המשתמשים הפכה לפתרון טכני חיוני.
דוגמה מובהקת למגמה זו היא מחשב אישי DGX Spark מבוסס בינה מלאכותית, שהוצג ב-Computex 2026. המכשיר מתהדר בעיצוב שולחני קומפקטי אך מספק ביצועים של מערכת מחשוב-על מיניאטורית הודות לשבב-על יחיד של Nvidia GB10 Grace Blackwell.
הפעולה העצמאית של המכשיר מסתמכת על מערכת זיכרון מאוחדת LPDDR5X בנפח 128 ג'יגה-בייט עם רוחב פס מהיר. בארכיטקטורת בינה מלאכותית, קיבולת הזיכרון והמהירות קובעות את היכולת לעבד מודלים של שפה גדולה (LLMs). זה מאפשר למהנדסי נתונים להריץ ישירות מודלים עם עד 200 מיליארד פרמטרים על המכשיר עצמו, במקום לפרוס אותם על שרתי ענן.
מבחינת המפרט, המעבד הגרפי של ארכיטקטורת Blackwell משלב ליבות Tensor מדור חמישי (פורמט FP4 Precision) המספקות פטה-פלופ אחד של כוח מחשוב. מעבד ה-ARM בעל 20 הליבות אחראי על תיאום נתונים בין מערכת הקבצים המקומית למודל הבינה המלאכותית.

תחנות העבודה המשרתות את צרכי הבינה המלאכותית בקצה הארגוני מגיעות כעת בגדלים קומפקטיים, מה שמקל על פריסתן בקני מידה שונים.
תמונה: אן קוואן
בדוכני התערוכה, פתרונות תשתית למגמה זו נבדלו בבירור באמצעות מערכות מסונכרנות מיצרנים מקוריים וספקי פתרונות שילוב חומרה ייעודיים. דוגמה בולטת לכך היא Leadtek, המציגה מגוון תחנות עבודה ושרתים ממערכות Nvidia-Certified Systems שלה. תחנת העבודה WinFast WS950 AI, המכוונת לצרכים התפעוליים המקומיים (הפנימיים) של עסקים קטנים ובינוניים, תומכת בתצורות מרובות GPU עם שני כרטיסי מסך מקצועיים מדגם Nvidia RTX PRO 6000 Blackwell Workstation Edition, המספקים סך של עד 192 ג'יגה-בייט של זיכרון GPU GDDR7. בקנה מידה גדול יותר, מערכת השרתים WinFast GS5855T שלהם מאפשרת שילוב של עד שמונה GPUs בארכיטקטורת RTX PRO Blackwell כדי לעמוד בדרישות של משימות אינטנסיביות של הסקה והדרכה בתחום הבינה המלאכותית.
אופטימיזציה של עלויות אבטחה ותפעול.
הפעלת בינה מלאכותית בקצה הרשת באמצעות מערכת חומרה מקומית עונה על שלושה אתגרים מרכזיים של תשתית הטכנולוגיה של ימינו. הראשון הוא אבטחת נתונים. כל המידע העסקי, קוד המקור הפנימי והנתונים האישיים מאוחסנים ומעובדים בסביבת ארגז חול (sandbox) מבודדת מהאינטרנט, מה שמגביל את הסיכון לדליפת נתונים לצדדים שלישיים.
פתרונות חדשים של Edge AI הוצגו ב-Computex 2026
הבא בתור הוא נושא עלויות המחשוב הקבועות. השכרת תשתית ענן, המחויבת על סמך סכומים אסימוניים, כרוכה בעלויות משתנות משמעותיות ככל שהיא מתרחבת. הפעלה על חומרה לא מקוונת הופכת עלויות אלו להשקעה בנכס קבוע, וממטבת את הפעילות לטווח ארוך. לבסוף, יש את נושא המדרגיות המקומית: באמצעות פרוטוקולי קישוריות במהירות גבוהה, משתמשים יכולים לחבר מערכות מחשוב קצה כדי לשתף משאבים, ולהגדיל את יכולות עיבוד מידול הקצה לגדלים עצומים.
מקור: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm







