Apple, Microsoft, Meta та Google нещодавно випустили нові моделі штучного інтелекту з меншою кількістю «параметрів», але все ще потужними можливостями, що є кроком технологічних груп, спрямованим на заохочення фінансово обмежених компаній до використання штучного інтелекту.
Ілюстрація: FT
Зазвичай, чим більша кількість параметрів, тим краща продуктивність програмного забезпечення штучного інтелекту, а також тим складніші та тонкіші його завдання. За оцінками, остання модель OpenAI GPT-4o та Google Gemini 1.5 Pro, обидві анонсовані цього тижня, мають понад 1 трильйон параметрів. Тим часом Meta навчає версію своєї моделі Llama з відкритим кодом, яка має 400 мільярдів параметрів.
Занепокоєння щодо даних та відповідальності за авторські права також спонукали великі технологічні компанії, такі як Meta та Google, випустити невеликі мовні моделі лише з кількома мільярдами параметрів, які є дешевшими, енергоефективними, настроюваними, потребують менше енергії для навчання та роботи, а також можуть запобігти захопленню конфіденційних даних.
«Отримуючи таку високу якість за нижчою ціною, ви фактично отримуєте доступ до більшої кількості програм для клієнтів», — сказав Ерік Бойд, корпоративний віцепрезидент Microsoft Azure AI Platform, яка продає моделі штучного інтелекту підприємствам.
Google, Meta, Microsoft та французький стартап Mistral також випустили моделі для невеликих мов програмування, але все ще демонструють прогрес і можуть краще зосередитися на конкретних завданнях.
Нік Клегг, президент Meta з глобальних справ, заявив, що нова модель Llama 3 з 8 мільярдами параметрів порівнянна з GPT-4. Microsoft заявила, що її невелика модель Phi-3 з 7 мільярдами параметрів перевершує GPT-3.5, попередню версію моделі OpenAI.
Мікрочіпи також можуть обробляти завдання локально на пристрої, а не надсилати інформацію в хмару, що може зацікавити клієнтів, які дбають про конфіденційність і хочуть гарантувати, що інформація залишається в мережі.
Шарлотта Маршалл, партнер юридичної фірми Addleshaw Goddard, сказала, що «однією з проблем, з якою, на мою думку, зіткнулися багато наших клієнтів» під час впровадження генеративних продуктів штучного інтелекту, є дотримання законодавчих вимог щодо обробки та передачі даних. Вона сказала, що менші моделі пропонують «можливість для бізнесу подолати» юридичні та фінансові проблеми.
Менші моделі також дозволяють запускати функції штучного інтелекту на таких пристроях, як мобільні телефони. Модель Google «Gemini Nano» вбудована в найновіші телефони Pixel та останній смартфон Samsung S24.
Apple також повідомила, що розробляє моделі штучного інтелекту для роботи на своєму бестселері iPhone. Минулого місяця гігант Кремнієвої долини випустив OpenELM, невелику модель, призначену для виконання текстових завдань.
Бойд з Microsoft сказав, що менші моделі призведуть до «цікавих застосувань, аж до телефонів і ноутбуків».
Директор OpenAI Сем Альтман заявив у листопаді, що компанія також пропонує клієнтам моделі штучного інтелекту різних розмірів, які «служать різним цілям». «Є деякі речі, які менші моделі справлятимуться справді добре. Я цьому радий», – сказав він.
Однак Альтман додав, що OpenAI все ще зосереджуватиметься на створенні більших моделей штучного інтелекту з масштабованістю, включаючи здатність міркувати, планувати та виконувати завдання, і зрештою досягати інтелекту людського рівня.
Хоанг Хай (за даними FT)
Джерело: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html






Коментар (0)