На мероприятии «День искусственного интеллекта 2023» на тему «ИИ — реконструкция реальности», которое пройдет 5 и 6 декабря, компания VinAI Artificial Intelligence Research and Application Company (корпорация Vingroup ) анонсировала исследовательский проект с открытым исходным кодом по большой языковой модели для вьетнамского языка — PhoGPT.
PhoGPT — это проект с открытым исходным кодом, а не проприетарное программное обеспечение, как ChatGPT от OpenAI. Благодаря открытому исходному коду, нет никаких коммерческих ограничений, и все стороны могут использовать PhoGPT для разработки собственных приложений, включая коммерческие модули. Таким образом, это своего рода платформа, предоставляющая сообществу возможность разрабатывать приложения, связанные с технологиями искусственного интеллекта, в стране.
По словам доктора Буй Хай Хуна, генерального директора компании VinAI Artificial Intelligence Research and Application Company, ограничения вьетнамских языковых моделей показали, что они не достигли оптимальной производительности и не имеют открытого исходного кода. Поэтому одной из неотложных задач, стоящих перед сообществом ИИ в целом и сообществом обработки естественного языка (NLP) в частности, является создание новой, более мощной модели, способной обрабатывать вьетнамский язык с высокой точностью и производительностью.
Эксперты по искусственному интеллекту утверждают, что с помощью модели языка больших данных с 7,5 миллиардами параметров, созданной на платформе декодирования Transformer, эта модель обучается с нуля, используя самые передовые доступные технологии, такие как механизм Flash Attention, экстраполяция длины контекста AliBi...
Эти методы не только помогают модели глубже понимать контекст, но и расширяют возможности естественного диалога и взаимодействия PhoGPT. Это делает модель универсальным и гибким инструментом, способным удовлетворить широкий спектр лингвистических потребностей пользователей.
Доктор Буй Хай Хунг добавил, что PhoGPT изначально разрабатывался компанией независимо от всех других моделей в мире . Благодаря модели с открытым исходным кодом вьетнамское сообщество может использовать и совершенствовать её более эффективно. Публичный исходный код PhoGPT, доступный пользователям, помогает создать среду, в которой сообщество пользователей может разрабатывать индивидуальные и уникальные приложения.
Одна из целей открытого исходного кода — заложить основу, чтобы людям не приходилось тратить время на переделку, а подразделения могли разрабатывать более крупные языковые модели PhoGPT. Это поможет обществу сформировать качественное сообщество разработчиков открытого исходного кода для крупных языковых моделей на вьетнамском языке, что положительно скажется на привлечении и применении многими компаниями в определённой области. Компания VinAI Artificial Intelligence Research and Application Company заявила, что с помощью PhoGPT она реализует план исследований и разработки приложений для индивидуальных пользователей, а также пакет специализированных решений для поддержки предприятий на вьетнамском языке в таких областях, как здравоохранение, образование и т. д.
PhoGPT заложила первые основы для разработки высокопроизводительных моделей вьетнамского языка как основы для разработки практичных и эффективных приложений в соответствии с правительственной стратегией развития ИИ до 2030 года.
БА ТАН
Источник






Комментарий (0)