DeepSeek מתמקדת במחקר ופיתוח של מודלים חדשים, במקום להופיע לעתים קרובות בתקשורת. צילום: SCMP . |
בשיתוף פעולה עם חוקרים מאוניברסיטת צינגהואה, DeepSeek הציגה שיטה חדשה לשיפור יכולות ההסקה של מודלים לשוניים גדולים (LLMs). השיטה, שפורסמה במאמר מחקר בערב ה-4 באפריל, מסייעת למודלים לשוניים להפיק תוצאות טובות ומהירות יותר עבור שאילתות נפוצות.
טכניקה זו משלבת שתי שיטות שהצליחו בעבר מ-DeepSeek. האחת היא מודל תגמול גנרטיבי (GRM), המאפשר למודל הבינה המלאכותית להעריך את עצמה ולשפר את תגובותיה על סמך תוצאות קודמות, והשנייה היא כוונון ביקורת מבוסס עקרונות עצמיים.
שתי השיטות מסתמכות על היבט ה"למידה העצמית" של בינה מלאכותית, ומפחיתות את ההסתמכות על משוב או הדרכה אנושיים ישירים, אך במטרה לספק תוצאות הקרובות יותר לציפיות האנושיות.
לדברי חוקרים, למרות היותה שיטה חדשה, DeepSeek-GRM משיגה תוצאות יוצאות דופן ומתחרה במודלים הידועים והיעילים ביותר של בינה מלאכותית הקיימים כיום. DeepSeek מתכננת להפוך מודלים של GRM לקוד פתוח, אך טרם נקבע מועד ספציפי.
לאחר שהשפיעה באופן עולמי עם מודל פלטפורמת V3 ומודל ההסקה R1 שלה, פרסמה DeepSeek מאמר אקדמי זה בארכיון המדעי המקוון arXiv, מה שעורר סקרנות לגבי הצעד הבא של החברה.
רויטרס צופה כי DeepSeek-R2, יורשו של R1, עשוי להיות מושק באפריל, לאור הפופולריות המתמשכת של קודמו. DeepSeek-R1 עורר בעבר סנסציה עולמית בעולם הטכנולוגיה הודות לביצועיו המעולים ביחס לעלות, מה שהופך אותו לתחרותי מול דגמים מובילים כיום.
DeepSeek שמרה על שתיקה בנוגע לשמועות. עם זאת, לפי מקורות מקומיים, חשבון שירות לקוחות של DeepSeek הכחיש את המידע בצ'אט קבוצתי עם לקוחות ארגוניים.
חברת DeepSeek, שנוסדה בהאנגג'ואו בשנת 2023 על ידי היזם ליאנג וונפנג, זכתה במהירות לתשומת לב עולמית בחודשים האחרונים. אך במקום לנצל את תהילתה הציבורית, החברה ממקדת את משאביה במחקר ופיתוח.
בעבר, DeepSeek שדרגה את דגם ה-V3 שלה, והוציאה את גרסה DeepSeek-V3-0324. על פי ההכרזה, עדכון זה כולל יכולות חשיבה משופרות, אופטימיזציה לפיתוח ממשק משתמש קדמי ושיפור מיומנויות הכתיבה בסינית.
בפברואר, הסטארט-אפ גם פתח חמישה מאגרי קוד בקוד פתוח, מה שמאשר את מחויבותו "להתקדמות בשקיפות מלאה". כמו כן, באותו חודש, החברה הכריזה על מחקר טכני בנושא "תשומת לב דלילה מקורית", המסייע בשיפור ביצועי מנהלי תואר ראשון בטיפול בכמויות אדירות של נתונים.
DeepSeek נתפסת כסמל לדינמיות של תעשיית הבינה המלאכותית הסינית, בתקופה שבה ארה"ב מנסה לרסן את הפיתוח הטכנולוגי של המדינה.
מקור: https://znews.vn/deepseek-gay-to-mo-post1543900.html






תגובה (0)