
A bemeneti adatokat szépen rendszerezik, mielőtt felhasználnák őket a mesterséges intelligencia betanításához.
A skálázható mesterséges intelligencia nem kerül gyakran a címlapokra, és nem is tartozik azon technológiai vállalatok közé, amelyek olyan termékeket gyártanak, amelyeket a felhasználók ténylegesen megérinthetnek. Az MI-fejlesztők számára azonban a teljes modell betanítási folyamatának szerves részét képezi.
A Scale AI munkája csendben, a színfalak mögött történik, ahol a nyers adatokat emberek dolgozzák fel, és alakítják át a gépek számára tanulságokká. Ennek köszönhetően az új intelligens rendszerek fokozatosan megérthetik a való világban az emberek által megjelenített nyelvet, képeket, érzelmeket és viselkedéseket.
Ki a Scale AI és mit csinál?
Az OpenAI-hoz, a Google-höz vagy a Metához képest a Scale AI viszonylag csendes szereplő. A cég nem hoz létre közvetlenül olyan chatbotokat, amelyek úgy tudnak beszélni, mint a valódi emberek, vagy olyan önvezető autókat, amelyek képesek olvasni a forgalmi helyzeteket, de kulcsszerepet játszik abban, hogy ezek a technológiák napról napra intelligensebbé váljanak.
A Scale AI-t 2016-ban alapították, amikor Alexandr Wang, az alapító még diák volt. Ahelyett, hogy az algoritmusfejlesztés útját követte volna, Wang egy másik utat választott: egy speciális adatfeldolgozó platformot épített a mesterséges intelligencia képzésének kiszolgálására.
Ebben a világban az adat a nyersanyag. De a nyers adatok, mint például a nem osztályozott képek, a rendezetlen beszélgetések vagy a zavaros videók , gyakran rendetlenek, és nincs közvetlen értékük a gépek számára.
A Scale AI feladata a hatalmas mennyiségű adat megtisztítása, kategorizálása és címkézése. Ez azt jelenti, hogy mind a rendszereket, mind a csapatokat úgy kell megtervezni, hogy minden apró részletet azonosítsanak és rendszerezzenek egy fényképen, egy bekezdésben vagy egy videófelvételben.
Például ahhoz, hogy egy önvezető autó megtanuljon a megfelelő helyen megállni, minden kameraképkockán egyértelműen azonosítani kell, hol van gyalogátkelőhely, hol van közlekedési lámpa, hol van gyalogos. Több millió ilyen adat birtokában a mesterséges intelligencia pontosan megtanulhatja a viselkedést.
Az ilyen adat-előkészítési lépéseknek köszönhetően az olyan modellek, mint a ChatGPT, a Claude vagy az autókban található virtuális asszisztensek megértik a természetes nyelvet, pontosan felismerik a képeket a valós környezetben, és emberszerű módon reagálnak.
A mesterséges intelligenciát okosnak akarjuk tanítani, de a legkisebb dologgal kell kezdeni
Nem számít, mennyire összetett egy mesterséges intelligencia modell, az csak egy üres csontváz adatok nélkül. Az emberekkel ellentétben, akik képesek a tapasztalataikból és az intuíciójukból tanulni, a gépek csak azt tudják megismételni, amit korábban láttak. Ezért a betanítási adatok döntő szerepet játszanak egy hatékony modell létrehozásában.
Ahhoz, hogy egy chatbot megértse, hogyan tesznek fel kérdéseket az emberek, több millió beszélgetésen kellett keresztülmennie. Ahhoz, hogy egy autó felismerje a gyalogosokat az esőben, több százezer hasonló fotót kellett látnia. Mindezeket a valós példákat helyesen kell címkézni, hogy a számítógép tanulhasson belőlük. A megfelelő címkék nélkül a mesterséges intelligencia hibázni fog. Elég sokszínű adat nélkül rosszul fog reagálni a valós környezetekben.
Ezért olyan fontos a Scale AI munkája. Nem csak adatokat gyűjtenek, hanem gondoskodnak arról is, hogy azok pontos, változatos és tanulható módon legyenek rendszerezve, hogy a jövőbeli modellek úgy reagálhassanak, mint egy ember.
Klasszikus példa erre az önvezető autók területe. Ahhoz, hogy egy autót betanítson a váratlan helyzetek kezelésére, például amikor valaki átkel az úton, vagy egy motoros rossz irányba megy, a mesterséges intelligencia modellnek több tízezer hasonló helyzetet kell látnia.
Az ilyen adatok nem lehetnek könnyen elérhetőek, és nem is lehet a gépre bízni, hogy magától tanuljon. Valakinek elő kell készítenie, meg kell szerveznie és biztosítania kell a pontosságukat, mielőtt a mesterséges intelligencia megkezdhetné a tanulási folyamatot.
Itt jön képbe a Scale AI. Nem tankönyvi tudásból, hanem milliárdnyi gondosan finomított valós példából vonnak le tanulságokat. Minden egyes adatfolyam, ami áthalad a kezükön, a modern MI-alapú kogníció építőköve lesz.
A labortól az utcákig az adat továbbra is a király
A Scale AI nem csak szövegekre korlátozódik, hanem az önvezető autók számítógépes látásának képzésében is részt vesz. Olyan technológiai vállalatok, mint a Tesla, a Toyota és a General Motors, mind együttműködtek a Scale AI-val, hogy megtanítsák az autókat a gyalogosok felismerésére, a közlekedési táblák olvasására és a váratlan helyzetek kezelésére.
Emellett a Scale AI más területeket is támogat, például a védelmet, a műholdakat és a térképeket. Feldolgozzák a kamerákból, radarokból és az űrből készült fényképekből származó képeket, hogy segítsék a modelleket a terep felismerésében, az objektumok osztályozásában vagy a kockázatok korai észlelésében. Egy műholdkép csupán egy hegyi jelenetnek tűnhet, de a Scale AI csapatának kezei alatt olyan adathalmazzá válhat, amely segít a gépnek megjósolni a tűzvészek irányát.
A számos területre való terjeszkedés azt mutatja, hogy a Scale AI nem csupán egy kiegészítő eszköz, hanem a mesterséges intelligencia világismeretének központi részévé válik. Ahogy a világ továbbra is versenyfutásban van az okosabb modellek létrehozásáért, olyan cégek, mint a Scale AI, csendben szilárd alapokat raknak le ehhez a versenyhez.
Forrás: https://tuoitre.vn/khi-scale-ai-day-hoc-cho-tri-tue-nhan-tao-20250616095516101.htm






Hozzászólás (0)