Az Apple, a Microsoft, a Meta és a Google is nemrégiben új, kevesebb „paraméterrel”, de mégis nagy képességekkel rendelkező mesterséges intelligencia modelleket dobott piacra. A technológiai csoportok ezzel a lépéssel próbálják ösztönözni a pénzügyi nehézségekkel küzdő vállalkozásokat a mesterséges intelligencia használatára.
Illusztráció: FT
Általánosságban elmondható, hogy minél nagyobb a paraméterek száma, annál jobb a mesterséges intelligencia szoftver teljesítménye, és annál összetettebbek és árnyaltabbak a feladatai. Az OpenAI legújabb GPT-4o modellje és a Google Gemini 1.5 Pro modellje, amelyeket ezen a héten jelentettek be, a becslések szerint több mint 1 billió paraméterrel rendelkezik. Eközben a Meta a nyílt forráskódú Llama modelljének 400 milliárd paraméteres verzióját képezi.
Az adat- és szerzői jogi felelősséggel kapcsolatos aggodalmak arra késztették a nagy technológiai vállalatokat, mint például a Meta és a Google, hogy mindössze néhány milliárd paraméterrel rendelkező, olcsóbb, energiahatékonyabb, testreszabhatóbb, kevesebb energiát igénylő betanítási és futtatási nyelvi modelleket adjanak ki, és megakadályozhatják az érzékeny adatok rögzítését is.
„Azáltal, hogy ezt a kiváló minőséget alacsonyabb áron kapjuk meg, valójában több alkalmazáshoz férhetünk hozzá az ügyfelek” – mondta Eric Boyd, a Microsoft Azure AI Platformjának vállalati alelnöke, amely AI-modelleket értékesít vállalkozásoknak.
A Google, a Meta, a Microsoft és a francia startup, a Mistral is kiadott már kisebb nyelvi modelleket, de továbbra is fejlődést mutatnak, és jobban tudnak a konkrét feladatokra koncentrálni.
Nick Clegg, a Meta globális ügyekért felelős elnöke szerint a Llama 3 új, 8 milliárd paramétert tartalmazó modellje összehasonlítható a GPT-4-gyel. A Microsoft szerint a kisméretű, 7 milliárd paramétert tartalmazó Phi-3 modelljük felülmúlja a GPT-3.5-öt, az OpenAI modelljének előző verzióját.
A mikrochipek a feladatokat lokálisan, az eszközön is feldolgozhatják ahelyett, hogy az információkat a felhőbe küldenék, ami vonzó lehet az adatvédelemre odafigyelő ügyfelek számára, akik biztosítani szeretnék, hogy az információk a hálózaton belül maradjanak.
Charlotte Marshall, az Addleshaw Goddard ügyvédi iroda partnere elmondta, hogy „szerintem az egyik kihívás, amellyel sok ügyfelünk szembesült” a generatív mesterséges intelligencia termékek bevezetésekor, az adatfeldolgozással és -átvitellel kapcsolatos jogi követelmények betartása. Elmondása szerint a kisebb modellek „lehetőséget kínálnak a vállalkozásoknak a jogi és költségbeli aggályok leküzdésére”.
A kisebb modellek lehetővé teszik a mesterséges intelligencia által vezérelt funkciók futtatását olyan eszközökön is, mint a mobiltelefonok. A Google „Gemini Nano” modellje a legújabb Pixel telefonokba és a Samsung legújabb S24 okostelefonjába van beépítve.
Az Apple azt is bejelentette, hogy mesterséges intelligencia modelleket fejleszt a legkelendőbb iPhone-jára. A múlt hónapban a szilícium-völgyi óriás kiadta az OpenELM-et, egy kis modellt, amelyet szövegalapú feladatok végrehajtására terveztek.
A Microsoft vezetője, Boyd szerint a kisebb modellek „érdekes alkalmazásokhoz vezetnek majd, egészen a telefonokig és laptopokig”.
Sam Altman, az OpenAI igazgatója novemberben azt nyilatkozta, hogy a cég különböző méretű MI-modelleket is kínál majd az ügyfeleknek, amelyek „különböző célokat szolgálnak”. „Vannak dolgok, amiket a kisebb modellek nagyon jól fognak csinálni. Izgatott vagyok emiatt” – mondta.
Altman azonban hozzátette, hogy az OpenAI továbbra is a nagyobb, skálázható MI-modellek építésére fog összpontosítani, beleértve az érvelés, a feladatok tervezése és végrehajtása, valamint végső soron az emberi szintű intelligencia elérésének képességét.
Hoang Hai (az FT szerint)
[hirdetés_2]
Forrás: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html






Hozzászólás (0)