(CLO) כלי המרת הדיבור לטקסט Whisper של OpenAI מפורסם כ"חזק ומדויק ברמה אנושית כמעט", אך יש לו חיסרון עיקרי אחד: הוא נוטה לפברק קטעי טקסט או אפילו משפטים שלמים!
חלק מהטקסטים שהיא מפברקת, המכונים בתעשייה כהזייתיים, יכולים לכלול פרשנות גזענית, אלימות ואפילו טיפולים רפואיים דמיוניים, אומרים מומחים.
מומחים אומרים שהמצאות כאלה חמורות משום ש-Whisper משמשת בתעשיות רבות ברחבי העולם לתרגום ותמלול ראיונות, יצירת טקסט וסרטוני וידאו עם כתוביות.
מדאיג עוד יותר, מרכזים רפואיים משתמשים בכלים מבוססי Whisper כדי לתעד התייעצויות בין מטופלים לרופאים, למרות אזהרת OpenAI כי אין להשתמש בכלי ב"אזורים בסיכון גבוה".
משפטים המתחילים ב-"#Ground truth" הם מה שנאמר בפועל, משפטים המתחילים ב-"#text" הם מה שווספר תמלל. צילום: AP
חוקרים ומהנדסים אומרים ש-Whisper מייצר הזיות לעתים קרובות במהלך השימוש. לדוגמה, חוקר מאוניברסיטת מישיגן אמר שמצא הזיות בשמונה מתוך עשר הקלטות שבדק.
מהנדס למידת מכונה מוקדם מצא מניפולציה בכמחצית מיותר מ-100 שעות של תמלילי Whisper שניתח. מפתח שלישי אמר שמצא הזיות כמעט בכל אחד מ-26,000 התמלילים שנוצרו באמצעות Whisper.
האשליה נמשכת אפילו בדגימות אודיו קצרות ומוקלטות היטב. מחקר שנערך לאחרונה על ידי מדעני מחשב מצא 187 עיוותים ביותר מ-13,000 קטעי אודיו ברורים שבדקו.
מגמה זו תוביל לעשרות אלפי שגיאות במיליוני הקלטות, אמרו החוקרים.
טעויות כאלה יכולות להיות בעלות "השלכות חמורות באמת", במיוחד במסגרת בית חולים, אמרה אלונדרה נלסון, פרופסור בבית הספר למדעי החברה במכון ללימודים מתקדמים.
"אף אחד לא רוצה לקבל אבחנה שגויה. צריך להיות מחסום גבוה יותר", אמר נלסון.
פרופסורות אליסון קונקה מאוניברסיטת קורנל ומונה סלואן מאוניברסיטת וירג'יניה בחנו אלפי קטעים קצרים שאספו מ-TalkBank, ארכיון מחקר הנמצא באוניברסיטת קרנגי מלון. הן קבעו שכמעט 40% מההזיות היו מזיקות או מטרידות משום שהדובר עלול להיות מובן לא נכון או מוצג בצורה שגויה.
דובר באחת ההקלטות תיאר "שתי בנות נוספות ואישה", אך ויספר בדה פרשנות גזענית נוספת, והוסיפה "שתי בנות נוספות ואישה, אממ, שהייתה שחורה".
בתעתיק אחר, ויספר המציא תרופה לא קיימת בשם "אנטיביוטיקה עם פעילות מוגברת".
בעוד שרוב המפתחים מכירים בכך שכלי תמלול יכולים לגרום לשגיאות כתיב או טעויות אחרות, מהנדסים וחוקרים אומרים שמעולם לא ראו כלי תמלול המופעל על ידי בינה מלאכותית הזיה כמו Whisper.
הכלי משולב במספר גרסאות של הצ'אטבוט המוביל של OpenAI, ChatGPT, והוא שירות משולב בפלטפורמת מחשוב הענן של אורקל ומיקרוסופט, המשרת אלפי חברות ברחבי העולם. הוא משמש גם לתמלול ותרגום טקסט לשפות רבות.
נגוק אן (לפי AP)
[מודעה_2]
מקור: https://www.congluan.vn/cong-cu-chuyen-giong-noi-thanh-van-ban-ai-cung-co-the-xuyen-tac-post319008.html
תגובה (0)