گفته میشود مدل هوش مصنوعی s1 که توسط محققان آمریکایی ساخته شده، تنها ۵۰ دلار هزینه عملیاتی دارد، اما قابلیتهای استدلالی معادل مدل o1 شرکت OpenAI را ارائه میدهد که هزینه بسیار بیشتری دارد. ظهور s1 پس از موفقیت چشمگیر DeepSeek رخ میدهد که در روزهای اخیر در سیلیکون ولی سر و صدا به پا کرده است.
جنگ «هوش مصنوعی ارزان» از زمان ظهور DeepSeek داغتر شده است
این تیم کد منبع s1 را به همراه کد و دادههای مورد استفاده برای ساخت مدل، در GitHub منتشر کرده است. مقالهای که هفته گذشته منتشر شد، فرآیند توسعه مدل را توضیح میدهد و تکنیکهای هوشمندانهای را که آنها استفاده کردهاند، برجسته میکند. این تیم به جای شروع از ابتدا با یک مدل استدلال جدید، از یک مدل زبانی موجود استفاده کرد و با استخراج قابلیتهای استدلال از مدل تجربی تفکر فلش Gemini 2.0 گوگل، یک فرآیند «تنظیم دقیق» انجام داد.
هزینههای عملیاتی هوش مصنوعی کمی کمتر از ۵۰ دلار است
آموزش مدل s1 تنها 30 دقیقه طول کشید و از 16 پردازنده گرافیکی Nvidia H100 استفاده شد. اگرچه هر پردازنده گرافیکی حدود 25000 دلار قیمت دارد، اما به لطف خدمات محاسبات ابری، هزینه اجاره این فرآیند کمتر از 50 دلار بود. به طور خاص، این تیم یک ترفند مفید کشف کرد: آموزش مدل برای "منتظر ماندن" قبل از ارائه پاسخ نهایی، که استدلال آن را بهبود بخشید و منجر به راهحلهای بهتری شد.
اگرچه s1 با هزینه کم دستاوردهای قابل توجهی داشته است، اما نگرانیهایی در مورد مقیاسپذیری آن وجود دارد. استفاده از مدل گوگل به عنوان یک «معلم»، سوالاتی را در مورد توانایی آن در رقابت با مدلهای پیشرو هوش مصنوعی امروزی مطرح میکند. گوگل احتمالاً با توجه به دعاوی جاری بین OpenAI و DeepSeek، اوضاع را از نزدیک زیر نظر خواهد داشت.
منبع: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
نظر (0)