AI combineren om Vietnamees te 'leren'
De leider van een bedrijf voor buitenlandse directe investeringen (FDI) in Vietnam wil snel Vietnamees leren en 90% van de inhoud van gangbare documenten kunnen lezen. Het probleem is dat hij het te druk heeft en slechts ongeveer 1 uur (van 12 tot 13 uur per dag) heeft om te studeren. Dus, hoe kan technologie worden toegepast op taalcursussoftware om hem te helpen snel vreemde talen te leren?
Hierboven staat het probleem van de leiderschapspositie van FDI-bedrijven voorgelegd aan universitair hoofddocent Dr. Dinh Dien, directeur van het Centrum voor computerlinguïstiek, University of Science , Nationale Universiteit van Vietnam, Ho Chi Minhstad.
Als universitair hoofddocent met veel wetenschappelijke onderzoeksonderwerpen en internationale publicaties over de toepassing van kunstmatige intelligentie (AI) bij machinale vertaling, kritische taalkunde en het lesgeven van Vietnamees aan buitenlanders, gelooft universitair hoofddocent Dien dat de toepassing van AI hard nodig is om problemen in de taalkunde op te lossen.
De eerste stap bij het leren van een taal is het aanleren van de klanken. De barrière hierbij is dat Vietnamees tonen en ritmes kent. Het zal erg moeilijk zijn om dit te leren aan leerlingen van niet-toontalen zoals Engels, Frans, enz. In plaats van bijvoorbeeld te vragen: "Ben je al naar bed?", zullen leerlingen zeggen: "Ben je al naar bed?", omdat ze de tonen niet kunnen onderscheiden. Het is noodzakelijk om hen te leren waar ze het spel moeten uitspreken, hoe ze hun mond moeten houden en hoe de uitspraak van een correcte of incorrecte uitspraak verschilt.
Momenteel kan AI-software in het vreemdetalenonderwijs de mondvorm van tandenpoetsen simuleren en geluiden afspelen die leerlingen kunnen imiteren. Vervolgens spelen leerlingen de geluiden af, nemen ze op in de software en gebruiken ze technologie om de uitspraak van de leerling te vergelijken met de standaarduitspraak van de software, om zo hun uitspraak snel te verbeteren. Al deze stappen vereisen de inzet van AI.
Een ander voorbeeld: volgens het Vietnamese Woordenboek van het Instituut voor Taalkunde, onder redactie van wijlen professor Hoang Phe, telt de oorspronkelijke Vietnamese woordenschat ongeveer 34.000 woorden. Berekeningen tonen aan dat ongeveer 10% van de woorden aan de machine moet worden aangeleerd, wat overeenkomt met 3400 woorden aan toepassingsinformatie, zodat de machine ongeveer 90% van de gangbare Vietnamese teksten kan lezen. Om deze gegevenstabel te verkrijgen, moest universitair hoofddocent Dien kunstmatige intelligentie (AI) gebruiken om het woordenschatsysteem in het Vietnamese corpus te labelen.
Je zou kunnen zeggen dat AI de manier van lesgeven en leren in het onderwijs heeft veranderd. Sterker nog, er zijn veel AI-toepassingen ontwikkeld om het lesgeven en leren sneller en effectiever te maken.
Het interessante verhaal over de combinatie van informatica en taalkunde hierboven laat zien dat het proces van het trainen en toepassen van AI in de praktijk zeer noodzakelijk is, maar niet eenvoudig. De data moet worden opgedeeld in vele identificatielagen, en op elke laag moet elke variabele worden verwerkt met verschillende specifieke identificatoren.
Als machines taal leren...
AI helpt mensen niet alleen talen te leren, maar helpt ook systemen die taalintelligentie ondersteunen. Machines worden getraind en verbeteren zich elke dag.
Vergelijkbaar met het verhaal van universitair hoofddocent Dien, ziet u hieronder nog een duidelijk voorbeeld van hoe een intelligente assistent menselijke taal begrijpt.
Het is het proces van onderzoek en ontwikkeling van de Vietnamese spraakassistent Kiki in auto's, om stemmen met veel verschillende regionale accenten goed te herkennen. In de computerwetenschappen is spraakherkenning een belangrijke tak van kunstmatige intelligentie (AI), die menselijke stemmen omzet in een bruikbaar en begrijpelijk formaat voor computertoepassingen. Deze technologie vormt een brug tussen machines en mensen. Spraakassistenten zijn wereldwijd onmisbare applicaties geworden. De meest populaire zijn: Apple's Siri, Google Assistant, Amazon Alexa en Kiki in Vietnam.
De heer Nguyen Hoang Khanh Duy, die de eerste regels code voor Kiki schreef, vertelde dat taalgegevens een belangrijke rol spelen bij het trainen van een AI-model dat slim genoeg is om stemmen te herkennen en gebruikers de juiste informatie te geven.
Een zeer belangrijke functie voor gebruikers van de Vietnamese assistent Kiki in auto's is bijvoorbeeld navigatie. Daarom moet het productontwikkelingsteam data en vocabulaire voorbereiden om commando's van gebruikers "soepel" te ondersteunen. Na het verzamelen van data en het trainen van het model is de index die de kwaliteit van de spraakherkenning in de latere versie weergeeft, met 40% verbeterd ten opzichte van het origineel.
Spraakherkenning in auto's beperkt zich niet tot navigatie- en lokalisatieproblemen, maar bestrijkt ook veel andere kwesties.
Het specifieke gebruik van Kiki in auto's vereist bijvoorbeeld veel lawaai van de motor, wind of verkeersapparatuur op de weg, wat direct van invloed is op de kwaliteit van Kiki's stemherkenning in de auto. Daarom moet het Kiki-team proberen de lawaaiige omstandigheden op te lossen door de data van het spreken in lawaaiige omstandigheden te verbeteren, zodat deze zo goed mogelijk overeenkomt met de werkelijkheid.
Bovendien probeert Kiki, met behulp van nieuwe technieken zoals zelfgestuurd leren, zelfs van ongelabelde data te "leren" om het model verder te verbeteren. De stabiliteit van deze Vietnamese spraakassistent wordt verbeterd door continue training en productupgrades.
Het is duidelijk dat technologische vooruitgang elke dag, elk uur plaatsvindt. ChatGPT, gelanceerd eind 2022, heeft gedeeltelijk antwoord gegeven op de vraag hoe big data werkt. Technologie dringt steeds meer door tot het hart van het leven, met name op het gebied van onderwijs, taal en andere gebieden die voorheen sterk afhankelijk waren van mensen. AI herdefinieert de manier waarop we leren, werken en leven... zoals de specifieke voorbeelden hierboven.
Bron
Reactie (0)