لی کای-فو، بنیانگذار 01.ai و رئیس سابق گوگل چین، گفت: شرکت‌های چینی با ساخت مدل‌هایی که بر اساس حجم کمتری از داده‌ها آموزش دیده‌اند و به قدرت محاسباتی کمتر اما سخت‌افزار بهینه نیاز دارند، هزینه‌ها را کاهش می‌دهند.

طبق رتبه‌بندی‌هایی که اخیراً توسط UC Berkeley SkyLab و LMSYS اعلام شده است، مدل Yi-Lingtning از استارتاپ 01.ai در رتبه سوم، به طور مشترک با Grok-2 از x.AI، پس از OpenAI و گوگل قرار گرفت. این رتبه‌بندی بر اساس امتیاز کاربران برای پاسخ به پرسش‌ها است.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
کاهش هزینه‌های عملیات هوش مصنوعی راهی برای رقابت چین با آمریکا است. عکس: فایننشال تایمز

01.ai و DeepSeek شرکت‌های هوش مصنوعی در سرزمین اصلی هستند که استراتژی تمرکز بر مجموعه داده‌های کوچک‌تر برای آموزش مدل‌ها را در پیش گرفته‌اند، در حالی که نیروی انسانی ارزان و بسیار ماهر را استخدام می‌کنند.

فایننشال تایمز اعلام کرد هزینه استنتاج Yi-Lightning به ازای هر میلیون توکن ۱۴ سنت است، در حالی که این هزینه برای GPT o1-mini شرکت OpenAI، ۲۶ سنت است. در همین حال، GPT 4o تا ۴.۴۰ دلار به ازای هر میلیون توکن هزینه دارد. تعداد توکن‌های مورد استفاده برای تولید پاسخ به پیچیدگی هر پرس‌وجو بستگی دارد.

بنیانگذاران Yi-Lightning فاش کردند که این شرکت قبل از تنظیم دقیق برای موارد استفاده مختلف، 3 میلیون دلار برای «آموزش اولیه» هزینه کرده است. لی گفت که هدف آنها «ایجاد بهترین مدل» نبوده، بلکه ساخت یک مدل رقابتی بوده که «5 تا 10 برابر ارزان‌تر» باشد.

روشی که 01.ai، DeepSeek، MiniMax و Stepfun به کار برده‌اند، «مدل‌سازی تخصصی» نام دارد - که به سادگی به معنای ترکیب چندین شبکه عصبی آموزش‌دیده بر روی مجموعه داده‌های خاص دامنه است.

محققان این رویکرد را به عنوان راهی کلیدی برای دستیابی به همان سطح از هوش مدل‌های کلان داده اما با قدرت محاسباتی کمتر می‌بینند. با این حال، مشکل این رویکرد این است که مهندسان باید فرآیند آموزش را به جای فقط یک مدل کلی، با «چندین متخصص» هماهنگ کنند.

به دلیل مشکلات دسترسی به تراشه‌های هوش مصنوعی پیشرفته، شرکت‌های چینی به توسعه مجموعه داده‌های باکیفیت روی آورده‌اند که می‌توانند برای آموزش مدل‌های تخصصی مورد استفاده قرار گیرند و از این طریق با رقبای غربی رقابت کنند.

لی گفت که 01.ai روش‌های غیرسنتی برای جمع‌آوری داده‌ها دارد، مانند اسکن کتاب‌ها یا جمع‌آوری مقالات در برنامه پیام‌رسان WeChat که در وب‌سایت عمومی قابل دسترسی نیستند.

بنیانگذار معتقد است که چین با داشتن انبوهی از استعدادهای فنی ارزان، در موقعیت بهتری نسبت به ایالات متحده قرار دارد.

(به نقل از فایننشال تایمز، بلومبرگ)

متا مدل هوش مصنوعی «خودآموز» را راه‌اندازی کرد غول رسانه‌های اجتماعی متا به تازگی از یک مدل هوش مصنوعی جدید با ویژگی ارزیابی خودآموز (STE) رونمایی کرده است که می‌تواند دخالت انسان را در فرآیند توسعه هوش مصنوعی محدود کند.