A mesterséges intelligenciával foglalkozó vállalatok igyekeznek nagy hasznot húzni a „kis nyelvi modellekből”.

[hirdetés_1]

Az Apple, a Microsoft, a Meta és a Google is nemrégiben új, kevesebb „paraméterrel” rendelkező, de mégis nagy teljesítményű mesterséges intelligencia modelleket dobott piacra. Ez a lépés ezen technológiai csoportok azon törekvése, hogy a korlátozott költségvetéssel rendelkező vállalkozásokat is ösztönözzék a mesterséges intelligencia használatára.

A vállalatok nagy profitra törekszenek a kis nyelvi modellekből (1. ábra). — Illusztrációs fotó: FT

Általánosságban elmondható, hogy minél nagyobb a paraméterek száma, annál jobb a mesterséges intelligencia szoftverének teljesítménye, és annál összetettebbé és árnyaltabbá válnak a feladatai. Az OpenAI legújabb GPT-4o modellje és a Google Gemini 1.5 Pro modellje, amelyeket ezen a héten jelentettek be, a becslések szerint több mint 1 billió paraméterrel rendelkezik. Eközben a Meta a nyílt forráskódú Llama modelljének 400 milliárd paraméteres verzióját képezi.

Az adat- és szerzői jogi felelősséggel kapcsolatos aggodalmak arra is késztették a nagy technológiai vállalatokat, mint például a Meta és a Google, hogy kisebb, mindössze néhány milliárd paraméterrel rendelkező nyelvi modelleket adjanak ki, amelyek olcsóbbak, energiahatékonyabbak, testreszabhatóbbak, kevesebb energiát igényelnek a betanításukhoz és futtatásukhoz, és megakadályozhatják az érzékeny adatok veszélybe kerülését is.

„Azáltal, hogy ilyen magas minőséget érünk el alacsonyabb áron, valójában több alkalmazáshoz férhetünk hozzá az ügyfelek…” – mondta Eric Boyd, a Microsoft Azure AI Platformjának alelnöke, amely AI-modelleket értékesít vállalkozásoknak.

A Google, a Meta, a Microsoft és a francia Mistral startup is kiadott már kisebb nyelvi modelleket, de ezek még mindig mutatnak fejlesztési potenciált, és jobban fókuszálhatók konkrét feladatokra.

Nick Clegg, a Meta globális ügyekért felelős elnöke szerint a Llama 3 új, 8 milliárd paraméterrel rendelkező modellje összehasonlítható a GPT-4-gyel. A Microsoft szerint a kisebb, 7 milliárd paraméterrel rendelkező Phi-3 modelljük jobban teljesít, mint a GPT-3.5, az OpenAI modell korábbi verziója.

A kisebb modellek a feladatokat lokálisan, az eszközön is képesek kezelni ahelyett, hogy az információkat a felhőbe küldenék, ami vonzó lehet az adatvédelemre odafigyelő ügyfelek számára, akik biztosítani szeretnék, hogy az információk a belső hálózatukon belül maradjanak.

Charlotte Marshall, az Addleshaw Goddard ügyvédi iroda adminisztrátora szerint „az egyik kihívás, amellyel véleményem szerint sok ügyfelünk szembesült” a generatív mesterséges intelligencia termékek bevezetésekor, az adatfeldolgozásra és -átvitelre vonatkozó jogi követelmények betartása. Azt mondja, hogy a kisebb modellek „lehetőséget kínálnak a vállalkozásoknak a jogi és költségbeli aggályok leküzdésére”.

A kisebb modellek lehetővé teszik a mesterséges intelligencia által vezérelt funkciók futtatását olyan eszközökön is, mint a mobiltelefonok. A Google „Gemini Nano” modellje a legújabb Pixel telefonokba és a Samsung legújabb S24 okostelefonjába van beépítve.

Az Apple azt is bejelentette, hogy mesterséges intelligencia modelleket fejleszt a legkelendőbb iPhone-ján való futtatáshoz. A szilícium-völgyi óriás a múlt hónapban mutatta be az OpenELM modellt, egy kisméretű modellt, amelyet szövegalapú feladatok végrehajtására terveztek.

A Microsoft vezetője, Boyd szerint a kisebb eszközök „izgalmas alkalmazásokhoz vezetnek majd, egészen a telefonokig és laptopokig”.

Sam Altman, az OpenAI igazgatója novemberben azt nyilatkozta, hogy különböző méretű MI-modelleket is kínálnak az ügyfeleknek, és „különböző célokat szolgálnak”. Azt mondta: „Vannak dolgok, amiket a kisebb modellek nagyon jól fognak csinálni. Nagyon izgatott vagyok emiatt.”

Altman azonban hozzátette, hogy az OpenAI továbbra is a nagyobb, skálázható MI-modellek építésére fog összpontosítani, amelyek képesek logikusan gondolkodni, tervezni és feladatokat végrehajtani, végső soron elérve az emberi szintű intelligenciát.

Hoang Hai (az FT szerint)

[hirdetés_2]
Forrás: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html