شرکت‌های هوش مصنوعی به دنبال سود کلان از «مدل‌های زبانی کوچک» هستند.

اپل، مایکروسافت، متا و گوگل همگی اخیراً مدل‌های جدید هوش مصنوعی را با «پارامترهای» کمتر اما همچنان قابلیت‌های قدرتمند منتشر کرده‌اند. این اقدام تلاشی از سوی این گروه‌های فناوری است تا کسب‌وکارهایی با بودجه محدود را تشویق کنند که همچنان بتوانند از هوش مصنوعی استفاده کنند.

شرکت‌ها به دنبال سودهای کلان از مدل‌های زبانی کوچک هستند (شکل 1). — عکس مصور: FT

به‌طورکلی، هرچه تعداد پارامترها بیشتر باشد، عملکرد نرم‌افزار هوش مصنوعی بهتر و وظایف آن پیچیده‌تر و ظریف‌تر می‌شود. تخمین زده می‌شود که جدیدترین مدل GPT-4o شرکت OpenAI و Gemini 1.5 Pro گوگل که هر دو این هفته معرفی شدند، بیش از ۱ تریلیون پارامتر داشته باشند. در همین حال، Meta در حال آموزش یک نسخه ۴۰۰ میلیارد پارامتری از مدل متن‌باز Llama خود است.

نگرانی‌ها در مورد داده‌ها و مسئولیت کپی‌رایت، شرکت‌های بزرگ فناوری مانند متا و گوگل را نیز بر آن داشته است تا مدل‌های زبانی کوچک‌تری را با تنها چند میلیارد پارامتر منتشر کنند که ارزان‌تر، کم‌مصرف‌تر، قابل تنظیم‌تر، نیازمند قدرت کمتری برای آموزش و اجرا هستند و همچنین می‌توانند از به خطر افتادن داده‌های حساس جلوگیری کنند.

اریک بوید، معاون رئیس پلتفرم هوش مصنوعی Azure مایکروسافت، که مدل‌های هوش مصنوعی را به کسب‌وکارها می‌فروشد، گفت: «با دستیابی به چنین کیفیت بالایی با هزینه کمتر، در واقع برنامه‌های بیشتری برای دسترسی مشتریان خواهید داشت...».

گوگل، متا، مایکروسافت و استارتاپ فرانسوی میسترال نیز مدل‌های زبانی کوچک‌تری منتشر کرده‌اند، اما همچنان پتانسیل بهبود را نشان می‌دهند و می‌توانند روی وظایف خاص بهتر متمرکز شوند.

نیک کلگ، رئیس امور جهانی در متا، گفت مدل جدید ۸ میلیارد پارامتری لاما ۳ با GPT-4 قابل مقایسه است. مایکروسافت گفت مدل کوچکتر Phi-3 آن، با ۷ میلیارد پارامتر، عملکرد بهتری نسبت به GPT-3.5، نسخه قبلی مدل OpenAI، دارد.

مدل‌های کوچک‌تر همچنین می‌توانند وظایف را به صورت محلی روی دستگاه انجام دهند، به جای ارسال اطلاعات به فضای ابری، که می‌تواند برای مشتریانی که به حریم خصوصی اهمیت می‌دهند و می‌خواهند از نگهداری اطلاعات در شبکه داخلی خود اطمینان حاصل کنند، جذاب باشد.

شارلوت مارشال، مدیر شرکت حقوقی آدلشاو گودارد، می‌گوید: «به نظر من یکی از چالش‌هایی که بسیاری از مشتریان ما هنگام پذیرش محصولات هوش مصنوعی مولد با آن مواجه بوده‌اند، رعایت الزامات قانونی برای پردازش و انتقال داده‌ها است.» او می‌گوید مدل‌های کوچک‌تر «فرصتی برای کسب‌وکارها فراهم می‌کنند تا بر» نگرانی‌های قانونی و هزینه‌ای غلبه کنند.

مدل‌های کوچک‌تر همچنین امکان اجرای ویژگی‌های هوش مصنوعی را روی دستگاه‌هایی مانند تلفن‌های همراه فراهم می‌کنند. مدل «Gemini Nano» گوگل در جدیدترین گوشی‌های پیکسل و جدیدترین گوشی هوشمند S24 سامسونگ تعبیه شده است.

اپل همچنین فاش کرده است که در حال توسعه مدل‌های هوش مصنوعی برای اجرا بر روی پرفروش‌ترین آیفون خود است. ماه گذشته، این غول سیلیکون ولی مدل OpenELM را منتشر کرد، مدلی کوچک که برای انجام وظایف مبتنی بر متن طراحی شده است.

بوید از مایکروسافت گفت که دستگاه‌های کوچک‌تر به «اپلیکیشن‌های هیجان‌انگیز، از تلفن گرفته تا لپ‌تاپ» منجر خواهند شد.

سم آلتمن، مدیر OpenAI، در ماه نوامبر گفت که آنها همچنین مدل‌های هوش مصنوعی با مقیاس‌های مختلف را به مشتریان ارائه می‌دهند و «اهداف متمایزی را دنبال می‌کنند». او گفت: «برخی کارها وجود دارد که مدل‌های کوچک‌تر واقعاً به خوبی انجام می‌دهند. من از این بابت بسیار هیجان‌زده‌ام.»

با این حال، آلتمن افزود که OpenAI همچنان بر ساخت مدل‌های هوش مصنوعی بزرگ‌تر و مقیاس‌پذیر که قادر به استدلال، برنامه‌ریزی و اجرای وظایف باشند، متمرکز خواهد ماند و در نهایت به هوشی در سطح انسان دست خواهد یافت.

هوانگ های (طبق گزارش فایننشال تایمز)

منبع: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html