На мероприятии, посвященном Дню искусственного интеллекта 2023 года и прошедшем 5 и 6 декабря под девизом «ИИ — перестройка реальности», компания VinAI Artificial Intelligence Research and Application Company ( Vingroup ) объявила о своем исследовательском проекте с открытым исходным кодом, посвященном крупной языковой модели, разработанной специально для вьетнамского языка, под названием PhoGPT.
PhoGPT — это проект с открытым исходным кодом, в отличие от проприетарного программного обеспечения, такого как ChatGPT от OpenAI. Благодаря открытому исходному коду, нет никаких коммерческих ограничений; все желающие могут использовать PhoGPT для разработки собственных приложений, в том числе и для коммерческих целей. По сути, это платформа для отечественного сообщества, разрабатывающего приложения, связанные с искусственным интеллектом.
По словам доктора Буй Хай Хунга, генерального директора компании VinAI, занимающейся исследованиями и применением искусственного интеллекта, ограничения существующих моделей обработки вьетнамского языка свидетельствуют о том, что они не достигли оптимальной производительности и не имеют открытого исходного кода. Поэтому одной из неотложных задач, стоящих перед сообществом ИИ в целом и сообществом обработки естественного языка (NLP) в частности, является создание новой, более мощной модели, способной обрабатывать вьетнамский язык с высокой точностью и эффективностью.
Эксперты в области искусственного интеллекта считают, что эта модель языка, основанная на больших данных и содержащая 7,5 миллиарда параметров, построена на платформе декодирования Transformer и была обучена с нуля с использованием самых передовых доступных методов, таких как Flash Attention и экстраполяция длины контекста AliBi.
Эти методы не только помогают модели глубже понимать контекст, но и улучшают способность PhoGPT к естественному диалогу и взаимодействию. Это делает модель универсальным и гибким инструментом, способным удовлетворить разнообразные языковые потребности своих пользователей.
Доктор Буй Хай Хунг добавил, что PhoGPT был разработан компанией с нуля, независимо от всех других моделей в мире . Благодаря модели с открытым исходным кодом, сообщество во Вьетнаме может использовать и совершенствовать его. Публичный доступ к исходному коду PhoGPT создает среду и сообщество, где пользователи могут разрабатывать уникальные и индивидуальные приложения.
Одна из целей открытого исходного кода — создание платформы, где людям не нужно ничего переделывать, что позволит организациям и дальше развивать большую языковую модель PhoGPT. Это поможет обществу создать качественное сообщество разработчиков открытого исходного кода для большой языковой модели вьетнамского языка, что окажет положительное влияние на многие компании, которые смогут участвовать и применять её в различных областях. Компания VinAI, занимающаяся исследованиями и разработкой приложений в области искусственного интеллекта, заявила о планах разработки приложений для индивидуальных пользователей и комплексных решений для поддержки бизнеса на вьетнамском языке в таких областях, как здравоохранение и образование.
PhoGPT заложил первые основы для разработки высокопроизводительных моделей вьетнамского языка, послужив базой для создания практичных и эффективных приложений, соответствующих стратегии развития искусственного интеллекта правительства до 2030 года.
БА ТАН
Источник






Комментарий (0)