Kombinace umělé inteligence pro „výuku“ vietnamštiny
Vedoucí podniku zaměřeného na přímé zahraniční investice (FDI) ve Vietnamu se chce rychle naučit vietnamsky a být schopen přečíst 90 % obsahu běžných dokumentů. Problém je v tom, že je příliš zaneprázdněný a na studium má pouze asi 1 hodinu (od 12 do 13 hodin denně). Jak by tedy měla být technologie aplikována na software pro výuku jazyků, aby mu pomohla rychle se naučit cizí jazyky?
Výše je uveden problém vedoucí pozice společnosti FDI, který byl položen docentovi Dr. Dinh Dienovi, řediteli Centra pro počítačovou lingvistiku Univerzity věd Vietnamské národní univerzity v Ho Či Minově Městě.
Docent Dien, který má na starosti mnoho vědeckých výzkumných témat a mezinárodních publikací o aplikaci umělé inteligence (AI) ve strojovém překladu, kritické lingvistice a výuce vietnamštiny pro cizince, se domnívá, že aplikace AI je pro řešení lingvistických problémů velmi nezbytná.
Konkrétně prvním krokem k učení se jakéhokoli jazyka je naučit se hlásky jazyka. Problémem je, že vietnamština má tóny a rytmus, což bude při výuce netónových jazyků, jako je angličtina, francouzština atd., velmi obtížné. Například místo otázky: „Už jsi šel spát?“, se studenti zeptají: „Už jsi šel spát?“, protože neumí tóny rozlišit. Je nutné je naučit, kam při výslovnosti umístit hru, jak držet ústa a jak se liší správná a nesprávná výslovnost.
V současné době dokáže software s umělou inteligencí ve výuce cizích jazyků simulovat tvar úst při čištění zubů a přehrávat zvuky, které studenti napodobují. Studenti si poté zvuky přehrají, nahrají je do softwaru a pomocí technologie porovnají svou výslovnost se standardní výslovností ze softwaru, čímž se výslovnost rychle zlepší. Všechny výše uvedené kroky musí zahrnovat umělou inteligenci.
Dalším příkladem je Vietnamský slovník Ústavu lingvistiky, který editoval zesnulý profesor Hoang Phe, který uvádí, že původní vietnamská slovní zásoba obsahuje přibližně 34 000 slov. Výpočty ukazují, že je nutné stroj naučit asi 10 % slov, což odpovídá 3 400 slovům aplikačních informací, aby stroj dokázal přečíst asi 90 % běžných vietnamských textů. Aby docent Dien získal tuto datovou tabulku, musel použít umělou inteligenci a označit systém slovní zásoby ve vietnamském korpusu.
Dá se říci, že umělá inteligence změnila způsob výuky a učení ve vzdělávacím sektoru. Ve skutečnosti vzniklo mnoho aplikací umělé inteligence, které podporují rychlejší a efektivnější proces výuky a učení.
Zajímavý příběh o propojení informatiky a lingvistiky ukazuje, že proces trénování a aplikace umělé inteligence v praxi je velmi nezbytný, ale ne snadný. Data je třeba rozdělit do mnoha vrstev identifikace, přičemž v každé vrstvě musí být každá proměnná zpracována s různými specifickými identifikátory.
Když se stroje učí jazyk...
Umělá inteligence nejen pomáhá lidem učit se jazyky, ale také lépe pomáhá systémům, které jazykovou inteligenci podporují. Stroje se trénují a zlepšují každý den.
Podobně jako v příběhu docenta Diena je níže uveden další názorný příklad toho, jak inteligentní asistent rozumí lidské řeči.
Jedná se o proces výzkumu a vývoje vietnamského hlasového asistenta Kiki v automobilech, který umožňuje dobře rozpoznávat hlasy s mnoha různými regionálními přízvuky. V informatice je rozpoznávání hlasu důležitou oblastí umělé inteligence (AI), která převádí lidské hlasy do užitečného a srozumitelného formátu pomocí počítačových aplikací. Tato technologie je mostem mezi stroji a lidmi. Hlasoví asistenti se stali nepostradatelnými aplikacemi po celém světě . Mezi nejoblíbenější patří: Siri od Applu, Google Assistant, Amazon Alexa nebo Kiki ve Vietnamu.
Pan Nguyen Hoang Khanh Duy, který napsal první řádky kódu pro Kiki, uvedl, že pro trénování modelu umělé inteligence dostatečně chytrého na to, aby rozpoznával hlasy a reagoval na uživatele správnými informacemi, hrají klíčovou roli jazyková data.
Například velmi důležitou funkcí pro uživatele vietnamské asistentky Kiki v autě je navigace. Proto musí vývojový tým produktu připravit data a slovní zásobu, aby „plynule“ podporoval příkazy od uživatelů. Po procesu sběru dat a trénování modelu se index ukazující kvalitu rozpoznávání hlasu v novější verzi zlepšil o 40 % ve srovnání s originálem.
Rozpoznávání hlasu v automobilech se neomezuje pouze na problémy s navigací a lokalizací, ale zahrnuje i mnoho dalších problémů.
Například specifické použití Kiki v autě vyžaduje hodně hluku z motoru, větru nebo dopravních prostředků na silnici, což přímo ovlivňuje kvalitu Kikiina rozpoznávání hlasu v autě. Tým Kiki se proto musí snažit řešit hlučné podmínky vylepšením dat mluvením v hlučných podmínkách tak, aby co nejlépe odpovídaly skutečnému životu.
Kromě toho se Kiki s novými technikami ve světě, jako je samoučení, snaží „učit“ i z neoznačených dat, aby model dále vylepšila. Stabilita tohoto vietnamského hlasového asistenta se zlepšuje díky neustálému školení a upgradu produktů.
Technologický pokrok se samozřejmě děje každý den, každou hodinu. ChatGPT, spuštěný na konci roku 2022, částečně odpověděl na otázku, jak fungují big data. Technologie „vstupují“ do středu života, zejména do vzdělávání, jazyka, oblastí, které dříve silně závisely na lidech. Umělá inteligence nově definuje způsob, jakým se učíme, pracujeme, žijeme... jak je uvedeno v konkrétních příkladech výše.
Zdroj
Komentář (0)