اپل، مایکروسافت، متا و گوگل همگی اخیراً مدلهای جدید هوش مصنوعی را با «پارامترهای» کمتر اما همچنان قابلیتهای قدرتمند منتشر کردهاند، اقدامی از سوی گروههای فناوری برای تشویق کسبوکارهای دارای محدودیت مالی به استفاده از هوش مصنوعی.
تصویرسازی: FT
بهطورکلی، هرچه تعداد پارامترها بیشتر باشد، عملکرد نرمافزار هوش مصنوعی بهتر و وظایف آن پیچیدهتر و ظریفتر خواهد بود. تخمین زده میشود که جدیدترین مدل GPT-4o شرکت OpenAI و Gemini 1.5 Pro گوگل که هر دو این هفته معرفی شدند، بیش از ۱ تریلیون پارامتر داشته باشند. در همین حال، Meta در حال آموزش نسخهای ۴۰۰ میلیارد پارامتری از مدل متنباز Llama خود است.
نگرانیها در مورد دادهها و مسئولیت کپیرایت، شرکتهای بزرگ فناوری مانند متا و گوگل را نیز بر آن داشته است تا مدلهای زبانی کوچکی را با تنها چند میلیارد پارامتر منتشر کنند که ارزانتر، کممصرفتر، قابل تنظیمتر هستند، به انرژی کمتری برای آموزش و اجرا نیاز دارند و همچنین میتوانند از ضبط دادههای حساس جلوگیری کنند.
اریک بوید، معاون رئیس پلتفرم هوش مصنوعی Azure مایکروسافت، که مدلهای هوش مصنوعی را به کسبوکارها میفروشد، گفت: «با دستیابی به این کیفیت بالا با هزینه کمتر، در واقع برنامههای بیشتری برای دسترسی مشتریان فراهم میکنید.»
گوگل، متا، مایکروسافت و استارتآپ فرانسوی میسترال نیز مدلهای زبانی کوچکی منتشر کردهاند، اما همچنان پیشرفتهایی را نشان میدهند و میتوانند بهتر روی وظایف خاص تمرکز کنند.
نیک کلگ، رئیس امور جهانی متا، گفت مدل جدید ۸ میلیارد پارامتری لاما ۳ با GPT-4 قابل مقایسه است. مایکروسافت گفت مدل کوچک Phi-3 آن، با ۷ میلیارد پارامتر، از GPT-3.5، نسخه قبلی مدل OpenAI، بهتر عمل میکند.
میکروچیپها همچنین میتوانند وظایف را به صورت محلی روی دستگاه پردازش کنند، نه اینکه اطلاعات را به فضای ابری ارسال کنند، که میتواند برای مشتریانی که به حریم خصوصی اهمیت میدهند و میخواهند از حفظ اطلاعات در شبکه اطمینان حاصل کنند، جذاب باشد.
شارلوت مارشال، یکی از شرکای شرکت حقوقی آدلشاو گودارد، گفت که «به نظر من یکی از چالشهایی که بسیاری از مشتریان ما هنگام پذیرش محصولات هوش مصنوعی مولد با آن مواجه بودهاند»، رعایت الزامات قانونی پیرامون پردازش و انتقال دادهها است. او گفت مدلهای کوچکتر «فرصتی برای کسبوکارها فراهم میکنند تا بر» نگرانیهای قانونی و هزینهای غلبه کنند.
مدلهای کوچکتر همچنین امکان اجرای ویژگیهای هوش مصنوعی را روی دستگاههایی مانند تلفنهای همراه فراهم میکنند. مدل «Gemini Nano» گوگل در جدیدترین گوشیهای پیکسل و جدیدترین گوشی هوشمند S24 سامسونگ تعبیه شده است.
اپل همچنین فاش کرده است که در حال توسعه مدلهای هوش مصنوعی برای اجرا بر روی پرفروشترین آیفون خود است. ماه گذشته، این غول سیلیکون ولی OpenELM را منتشر کرد، یک مدل کوچک که برای انجام وظایف مبتنی بر متن طراحی شده است.
بوید از مایکروسافت گفت که مدلهای کوچکتر به «کاربردهای جالبی، از تلفن گرفته تا لپتاپ» منجر خواهند شد.
سم آلتمن، مدیر OpenAI، در ماه نوامبر گفت که این شرکت مدلهای هوش مصنوعی با اندازههای مختلف را نیز به مشتریان ارائه میدهد که «اهداف متمایزی را دنبال میکنند». او گفت: «بعضی کارها وجود دارد که مدلهای کوچکتر واقعاً به خوبی انجام میدهند. من از این بابت هیجانزدهام.»
با این حال، آلتمن افزود که OpenAI همچنان بر ساخت مدلهای هوش مصنوعی بزرگتر با قابلیت مقیاسپذیری، از جمله توانایی استدلال، برنامهریزی و اجرای وظایف و در نهایت دستیابی به هوش در سطح انسان، تمرکز خواهد کرد.
هوانگ های (طبق گزارش فایننشال تایمز)
منبع: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html






نظر (0)