اپل، مایکروسافت، متا و گوگل همگی اخیراً مدلهای جدید هوش مصنوعی را با «پارامترهای» کمتر اما همچنان قابلیتهای قدرتمند منتشر کردهاند. این اقدام تلاشی از سوی این گروههای فناوری است تا کسبوکارهایی با بودجه محدود را تشویق کنند که همچنان بتوانند از هوش مصنوعی استفاده کنند.
عکس مصور: FT
بهطورکلی، هرچه تعداد پارامترها بیشتر باشد، عملکرد نرمافزار هوش مصنوعی بهتر و وظایف آن پیچیدهتر و ظریفتر میشود. تخمین زده میشود که جدیدترین مدل GPT-4o شرکت OpenAI و Gemini 1.5 Pro گوگل که هر دو این هفته معرفی شدند، بیش از ۱ تریلیون پارامتر داشته باشند. در همین حال، Meta در حال آموزش یک نسخه ۴۰۰ میلیارد پارامتری از مدل متنباز Llama خود است.
نگرانیها در مورد دادهها و مسئولیت کپیرایت، شرکتهای بزرگ فناوری مانند متا و گوگل را نیز بر آن داشته است تا مدلهای زبانی کوچکتری را با تنها چند میلیارد پارامتر منتشر کنند که ارزانتر، کممصرفتر، قابل تنظیمتر، نیازمند قدرت کمتری برای آموزش و اجرا هستند و همچنین میتوانند از به خطر افتادن دادههای حساس جلوگیری کنند.
اریک بوید، معاون رئیس پلتفرم هوش مصنوعی Azure مایکروسافت، که مدلهای هوش مصنوعی را به کسبوکارها میفروشد، گفت: «با دستیابی به چنین کیفیت بالایی با هزینه کمتر، در واقع برنامههای بیشتری برای دسترسی مشتریان خواهید داشت...».
گوگل، متا، مایکروسافت و استارتاپ فرانسوی میسترال نیز مدلهای زبانی کوچکتری منتشر کردهاند، اما همچنان پتانسیل بهبود را نشان میدهند و میتوانند روی وظایف خاص بهتر متمرکز شوند.
نیک کلگ، رئیس امور جهانی در متا، گفت مدل جدید ۸ میلیارد پارامتری لاما ۳ با GPT-4 قابل مقایسه است. مایکروسافت گفت مدل کوچکتر Phi-3 آن، با ۷ میلیارد پارامتر، عملکرد بهتری نسبت به GPT-3.5، نسخه قبلی مدل OpenAI، دارد.
مدلهای کوچکتر همچنین میتوانند وظایف را به صورت محلی روی دستگاه انجام دهند، به جای ارسال اطلاعات به فضای ابری، که میتواند برای مشتریانی که به حریم خصوصی اهمیت میدهند و میخواهند از نگهداری اطلاعات در شبکه داخلی خود اطمینان حاصل کنند، جذاب باشد.
شارلوت مارشال، مدیر شرکت حقوقی آدلشاو گودارد، میگوید: «به نظر من یکی از چالشهایی که بسیاری از مشتریان ما هنگام پذیرش محصولات هوش مصنوعی مولد با آن مواجه بودهاند، رعایت الزامات قانونی برای پردازش و انتقال دادهها است.» او میگوید مدلهای کوچکتر «فرصتی برای کسبوکارها فراهم میکنند تا بر» نگرانیهای قانونی و هزینهای غلبه کنند.
مدلهای کوچکتر همچنین امکان اجرای ویژگیهای هوش مصنوعی را روی دستگاههایی مانند تلفنهای همراه فراهم میکنند. مدل «Gemini Nano» گوگل در جدیدترین گوشیهای پیکسل و جدیدترین گوشی هوشمند S24 سامسونگ تعبیه شده است.
اپل همچنین فاش کرده است که در حال توسعه مدلهای هوش مصنوعی برای اجرا بر روی پرفروشترین آیفون خود است. ماه گذشته، این غول سیلیکون ولی مدل OpenELM را منتشر کرد، مدلی کوچک که برای انجام وظایف مبتنی بر متن طراحی شده است.
بوید از مایکروسافت گفت که دستگاههای کوچکتر به «اپلیکیشنهای هیجانانگیز، از تلفن گرفته تا لپتاپ» منجر خواهند شد.
سم آلتمن، مدیر OpenAI، در ماه نوامبر گفت که آنها همچنین مدلهای هوش مصنوعی با مقیاسهای مختلف را به مشتریان ارائه میدهند و «اهداف متمایزی را دنبال میکنند». او گفت: «برخی کارها وجود دارد که مدلهای کوچکتر واقعاً به خوبی انجام میدهند. من از این بابت بسیار هیجانزدهام.»
با این حال، آلتمن افزود که OpenAI همچنان بر ساخت مدلهای هوش مصنوعی بزرگتر و مقیاسپذیر که قادر به استدلال، برنامهریزی و اجرای وظایف باشند، متمرکز خواهد ماند و در نهایت به هوشی در سطح انسان دست خواهد یافت.
هوانگ های (طبق گزارش فایننشال تایمز)
منبع: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html






نظر (0)