Vietnam.vn - Nền tảng quảng bá Việt Nam

משהו שעומד להפוך לזיכרון באינטרנט.

התפוצצות התוכן של בינה מלאכותית יצרה בעיית אמינות, שכן נתונים אנושיים גרידא הופכים לנדירים יותר ויותר.

ZNewsZNews09/06/2025

תוכן אנושי גרידא נמצא ברשימת המשאבים הנדירים בעידן הבינה המלאכותית. צילום: Advertising Week .

הופעתה של ChatGPT בשנת 2022 עוררה פיצוץ של תוכן המופעל על ידי בינה מלאכותית ברחבי האינטרנט. גרטנר צופה שעד 2026, 90% מתוכן האינטרנט ייווצר על ידי בינה מלאכותית, כולל טקסט, תמונות וסרטונים .

בינה מלאכותית מאומנת להבין את החשיבה האנושית. עם זאת, אם לא יהיו עוד נתונים טהורים שנוצרו על ידי בני אדם, טכנולוגיה זו תשתמש במידע הישן שלה, כמו מכונת צילום שמעתיקה את עצמה.

חוקרים רבים משווים תוכן מקורי שנוצר על ידי בני אדם למעין פלדה "נקייה" בעת המודרנית, המקבילה לנדירות וקושי למצוא. הם חוששים שאם איש לא יאחסן עותקים של נתונים לפני 2022, האינטרנט יאבד לחלוטין את שלמותו.

אסון היסטורי חוזר על עצמו.

בעידן שלאחר הגרעין, מדענים גילו שכל הפלדה שיוצרה לאחר 1945 הייתה מזוהמת. פצצות האטום זיהמו את האטמוספרה בקרינה, שהתפשטה למתכות שיוצרו באותה סביבה.

כתוצאה מכך, חלק ניכר מהפלדה הפך לבלתי שמיש עבור ציוד מדידה מדויק כמו מוני גייגר וחיישנים רגישים רבים אחרים. הפתרון היה להחזיר פלדה ישנה מספינות מלחמה שטבעו לפני המלחמה, כשהן שוכבות עמוק בקרקעית האוקיינוס, שם היא לא תושפע מנשורת רדיואקטיבית.

עבור מפתחי בינה מלאכותית, רוב המודלים מאומנים באמצעות מערכי נתונים עצומים של נתונים אנושיים שנאספו מהאינטרנט. אבל אם תוכנות של היום לומדות מטקסט שיצרה בעבר, המודלים מסתכנים בקריסה, מה שמדלל את מקוריותם ועומקם.

Noi dung dang tin cay anh 1

אוניית המערכה הינדנבורג, שטבעה במהלך מלחמת העולם הראשונה, חולצה. צילום: רויטרס קונקט.

זה הופך תוכן שנוצר על ידי בני אדם, במיוחד כזה שנוצר לפני 2022, לבעל ערך רב יותר, לדברי וויל אלן, סגן נשיא Cloudflare, המפעילה אחת מרשתות האינטרנט הגדולות בעולם . הוא טוען שזה עוזר למודלים של בינה מלאכותית, כמו גם לחברה כולה, להישאר מבוססים על מציאות משותפת. דברים היו מסתבכים ללא בסיס זה.

פלטפורמות חשובות במיוחד בתחומי היי-טק כמו רפואה, משפטים או מיסוי. לדוגמה, רופא צריך להסתמך על תוכן שנכתב על ידי מומחים אנושיים ועל מחקר עובדתי, ולא על מקורות שנוצרו על ידי בינה מלאכותית.

איום זה הופך גם הוא למציאות. שנה לאחר השקת ChatGPT, משקיע ההון סיכון פול גרהם סיפר כי נאלץ לחפש תוכן ישן יותר לצורך חיפוש פשוט כדי להימנע מ"פיתיון SEO שנוצר על ידי בינה מלאכותית". מאלטה אובל, מנהל הטכנולוגיה הראשי של סטארט-אפ הבינה המלאכותית Vercel, השיב כי גרהם למעשה סינן את האינטרנט אחר תוכן "לפני שהוא זוהם על ידי בינה מלאכותית".

מאט ריקארד, מהנדס לשעבר בגוגל, מסכים. הוא כתב בפוסט בבלוג משנת 2023 שבינה מלאכותית אוספת נתונים מהאינטרנט, אך יותר ויותר, חלק ניכר מהתוכן באינטרנט נוצר על ידי בינה מלאכותית עצמה. "קשה מאוד לזהות את הפלט של צ'אטנר. מציאת נתוני אימון שלא טופלו על ידי בינה מלאכותית תהפוך לקשה יותר ויותר", הסביר ריקארד.

"החיפוש אחר פלדה על קרקעית הים"

התשובה לבעיה זו טמונה בשימור גרסת הנתונים שנוצרה על ידי בני אדם מלפני פריחת הבינה המלאכותית. אחד החלוצים בתחום זה הוא ג'ון גרהם-קאמינג, חבר דירקטוריון ומנהל הטכנולוגיה הראשי של Cloudflare.

הפרויקט שלו, אתר LowBackgroundSteel.ai, מפרט מערכי נתונים, נתיבים ומדיה שהיו קיימים לפני 2022. דוגמה אחת שניתנה היא Arctic Code Vault של GitHub, ארכיון תוכנה בקוד פתוח הקבור במכרה פחם נטוש בנורבגיה, המכיל נתונים מאז פברואר 2020.

Noi dung dang tin cay anh 2

פרויקט שימור נתונים אנושיים של גרהם-קאמינג. צילום: Lowbackgroundsteel.ai.

מקור נתונים נוסף שציטט היה "wordfreq", פרויקט שעוקב אחר תדירות השימוש במילים באינטרנט. הבלשנית רובין ספיר שמרה עליו עד 2021.

"דור הבינה המלאכותית זיהם את הנתונים", אמרה ספיר. היא נתנה כדוגמה את האובססיה המוגזמת של ChatGPT למילה "delve", מה שהוביל להופעתה המוגברת לאחרונה. זה מעוות את הנתונים באינטרנט, מה שהופך אותם לפחות אמינים במשקף את האופן שבו בני אדם כותבים וחושבים.

מודלים של בינה מלאכותית שאומנו חלקית על תוכן סינתטי יכולים להאיץ זרימות עבודה ולחסל עייפות במשימות יצירתיות. עם זאת, מעבר לביצועים בלבד, משתמשים עדיין עשויים להזדקק להסתמך על תוכן מקורי שנוצר על ידי בני אדם לצורך הערכות מדויקות, בדומה לשימוש ב"פלדה ברמה נמוכה" לצורך מדידות מדויקות.

מדענים פיתחו שיטות שונות לייצור פלדה באמצעות חמצן טהור. על פי Business Insider , זה מזכיר לנו ששימור העבר עשוי להיות הדרך היחידה לבנות עתיד אמין.

מקור: https://znews.vn/thu-sap-thanh-hoai-niem-บน-internet-post1559151.html


תגובה (0)

השאירו תגובה כדי לשתף את התחושות שלכם!

באותה קטגוריה

מאת אותו מחבר

מוֹרֶשֶׁת

דְמוּת

עסקים

ענייני היום

מערכת פוליטית

מְקוֹמִי

מוּצָר

Happy Vietnam
תַעֲרוּכָה

תַעֲרוּכָה

אנר

אנר

80 שנה לאומה

80 שנה לאומה