חברות בינה מלאכותית מבקשות להרוויח בנדיבות מ"מודלים של שפה קטנה".

[מודעה_1]

אפל, מיקרוסופט, מטה וגוגל הוציאו לאחרונה מודלים חדשים של בינה מלאכותית עם פחות "פרמטרים" אך עדיין יכולות עוצמתיות. צעד זה הוא מאמץ של קבוצות טכנולוגיה אלו לעודד עסקים עם תקציבים מוגבלים עדיין להיות מסוגלים להשתמש בבינה מלאכותית.

חברות מחפשות רווחים גדולים ממודלים של שפה קטנה (איור 1). — צילום איור: FT

באופן כללי, ככל שמספר הפרמטרים גבוה יותר, כך ביצועי תוכנת הבינה המלאכותית טובים יותר ומשימותיה הופכות מורכבות ומסודרות יותר. מודל ה-GPT-4o האחרון של OpenAI ו-Gemini 1.5 Pro של גוגל, שניהם הוכרזו השבוע, מוערכים ביותר מטריליון פרמטרים. בינתיים, Meta מאמנת גרסה של 400 מיליארד פרמטרים של מודל ה-Llama בקוד פתוח שלה.

חששות בנוגע לנתונים ולזכויות יוצרים הובילו גם חברות טכנולוגיה גדולות כמו מטא וגוגל לשחרר מודלים של שפה קטנים יותר עם כמה מיליארד פרמטרים בלבד, שהם זולים יותר, חסכוניים יותר באנרגיה, ניתנים להתאמה אישית, דורשים פחות חשמל לאימון והפעלה, ויכולים גם למנוע פגיעה בנתונים רגישים.

"על ידי השגת איכות כה גבוהה בעלות נמוכה יותר, למעשה יהיו לכם יותר יישומים ללקוחות גישה...", אמר אריק בויד, סגן נשיא פלטפורמת Azure AI של מיקרוסופט, המוכרת מודלים של בינה מלאכותית לעסקים.

גוגל, מטה, מיקרוסופט והסטארט-אפ הצרפתי מיסטרל פרסמו גם מודלים קטנים יותר של שפות, אך הם עדיין מראים פוטנציאל לשיפור וניתן להתמקד בהם טוב יותר במשימות ספציפיות.

ניק קלג, נשיא לענייני עולם ב-Meta, אמר כי מודל 8 מיליארד הפרמטרים החדש של Llama 3 דומה ל-GPT-4. מיקרוסופט מסרה כי מודל Phi-3 הקטן יותר שלה, עם 7 מיליארד פרמטרים, מתפקד טוב יותר מ-GPT-3.5, הגרסה הקודמת של מודל OpenAI.

דגמים קטנים יותר יכולים גם להתמודד עם משימות באופן מקומי במכשיר במקום לשלוח מידע לענן, דבר שיכול לפנות ללקוחות מודעים לפרטיות שרוצים להבטיח שהמידע נשמר ברשת הפנימית שלהם.

שרלוט מרשל, מנהלת במשרד עורכי הדין אדלסהו גודארד, אומרת ש"אחד האתגרים שלדעתי רבים מלקוחותינו התמודדו איתם" בעת אימוץ מוצרי בינה מלאכותית גנרטיבית הוא עמידה בדרישות החוקיות לעיבוד והעברת נתונים. היא אומרת שמודלים קטנים יותר מציעים "הזדמנות לעסקים להתגבר" על חששות משפטיים ועלויות.

דגמים קטנים יותר מאפשרים גם לתכונות בינה מלאכותית לפעול על מכשירים כמו טלפונים ניידים. דגם ה-"Gemini Nano" של גוגל מוטמע בתוך טלפוני ה-Pixel החדשים ביותר ובסמארטפון ה-S24 החדש ביותר של סמסונג.

אפל חשפה גם שהיא מפתחת מודלים של בינה מלאכותית שיפעלו על האייפון הנמכר ביותר שלה. בחודש שעבר, ענקית עמק הסיליקון הוציאה את דגם OpenELM, דגם קטן שנועד לבצע משימות מבוססות טקסט.

בויד ממיקרוסופט אמר שמכשירים קטנים יותר יובילו ל"יישומים מרגשים, עד לטלפונים ולמחשבים ניידים".

מנהל OpenAI, סם אלטמן, אמר בנובמבר שהם מספקים גם מודלים של בינה מלאכותית בקנה מידה משתנה ללקוחות ו"משרתים מטרות שונות". הוא אמר, "יש כמה דברים שמודלים קטנים יותר יעשו ממש טוב. אני מאוד נרגש מזה".

עם זאת, אלטמן הוסיף כי OpenAI תישאר ממוקדת בבניית מודלים גדולים וניתנים להרחבה של בינה מלאכותית המסוגלים לחשוב, לתכנן ולבצע משימות, ובסופו של דבר להשיג אינטליגנציה ברמה אנושית.

הואנג האי (לפי ה-FT)

[מודעה_2]
מקור: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html