Покинув США и вернувшись домой, Нгуен Хоанг Куан и его коллеги из VILM разработали бесплатную систему искусственного интеллекта (ИИ), которую вьетнамцы могут использовать в сфере обслуживания клиентов. Ее скачивают более сотен тысяч раз в месяц.
В июне 2023 года 25-летний Нгуен Хоанг Куан и его коллеги 23-летний Фам Нхут Хуэй, инженер по искусственному интеллекту в ZaloAI, и 24-летний Дао Минь Зунг, аспирант Университета Корка (Ирландия), стали соучредителями некоммерческой организации VILM с целью помочь вьетнамцам опробовать самые передовые технологии искусственного интеллекта наиболее оптимальным способом.
После почти 6 месяцев исследований и практического применения команда успешно разработала три бесплатные модели ИИ, включая OpenHermes, VinaLlama и Vistral. Это основополагающие исследования для разработки систем ИИ, способных понимать намерения пользователя и действовать в соответствии с ними (модель больших действий). Эти модели применяются в таких областях технологий, как управление машинами, робототехника для более эффективной поддержки людей с ограниченными возможностями без помощи сиделок, помощь программистам в исправлении ошибок, виртуальные помощники для обслуживания клиентов и бесплатного задавания вопросов.
OpenHermes достигает 85 000 загрузок в месяц, входя в десятку самых скачиваемых языковых моделей на HuggingFace (крупнейшем в мире сайте для обмена моделями искусственного интеллекта). Скриншот
Модель OpenHermes — это крупная языковая модель, поддерживающая английский язык, как и ChatGPT, но с более высокими показателями. Пользователи могут загрузить модель на свои персональные компьютеры для использования без подключения к Интернету. Примечательно, что объём обучающих данных OpenHermes составляет всего 1/100 от обучающих данных ChatGPT от OpenAI. В настоящее время это приложение получает более 50 000 загрузок в месяц. OpenHermes-2.5 и OpenHermes-2.5-Vision используются более чем 40 стартапами в Кремниевой долине (США).
VinaLlama и Vistral — это две языковые модели, ориентированные на вьетнамский рынок и призванные помочь отечественным пользователям легче освоить самые передовые технологии искусственного интеллекта.
Хоанг Куан провёл 7 лет, обучаясь в США, и работал инженером-исследователем в OpenAI над моделью искусственного интеллекта ChatGPT, несмотря на то, что не окончил университет. В 2022 году он работал инженером по обработке данных в Microsoft и продукте Bing Chat от OpenAI, зарабатывая тысячи долларов. К 2023 году, столкнувшись с волной увольнений в сфере технологий в США, Куан понял, что рынок труда для выпускников очень унылый, но, увидев возможности во Вьетнаме, решил вернуться домой.
Нгуен Хоанг Куан. Фото: НВКК
В VILM Куан занимает должность главного инженера, отвечающего за исследования методов улучшения качества данных и обучения ИИ. Нхут Хюй отвечает за технические исследования в области обучения ИИ, а Минь Зунг предлагает новые методы в теоретических исследованиях.
Куан объяснил, что существующие крупные языковые модели, такие как ChatGPT (Large Language Model), могут обеспечивать только текстовый вывод, в то время как у людей есть множество способов общаться и получать знания. Именно поэтому команда стремится создать систему, способную гибко работать с различными типами ввода и вывода (получать и выводить различные типы данных, такие как язык, изображения, видео , звуки), не ограничиваясь только уровнем языка.
Чтобы достичь цели создания крупных моделей действий, команде пришлось решить две проблемы: безопасность и скорость. Современные приложения ИИ в основном используют пользовательские данные и отправляют их на серверы таких компаний, как OpenAI, для обработки, что вызывает опасения по поводу безопасности. Команда сосредоточилась на создании моделей ИИ, которые были бы достаточно компактными и быстрыми для обработки непосредственно на мобильных устройствах, при этом обеспечивая баланс между производительностью и скоростью, чтобы не влиять на пользовательский опыт.
Экспериментальная группа использовала данные, полученные от ИИ, для обучения самого ИИ, вместо того, чтобы пойти по пути использования данных из реальных источников. Поначалу у них возникли трудности с поиском вычислительных ресурсов (компьютеров для обучения ИИ), но позже им удалось убедить крупные компании и лаборатории по всему миру стать спонсорами.
Куан заявил, что главная цель создания этих продуктов — предоставить пользователям быстрый доступ к приложениям ИИ с качеством, не уступающим ChatGPT или Bing Chat, а также упростить исследования и создание моделей ИИ в будущем. Вместо использования ChatGPT, ограниченного вьетнамским языком и культурой, вьетнамские компании могут скачать VinaLlama на вьетнамском языке.
Языковая модель VinaLlama легко решает математические задачи на вьетнамском языке. На изображении представлена демонстрация продукта VinaLlama для решения математических задач. Скриншот.
Г-н Данг Хай Лок, основатель платформы для создания чат-ботов на основе искусственного интеллекта Mindmaid, отметил, что, с точки зрения разработчика приложений ИИ, он понимает, что стоимость и конфиденциальность данных — два вопроса, которые больше всего беспокоят компании при развертывании приложений ИИ. Наиболее приемлемым решением этой проблемы являются модели LLM с открытым исходным кодом, которые могут работать на корпоративной инфраструктуре и способны изучать (тонко настраивать) больше собственных данных предприятия. Поэтому вьетнамские модели LLM с открытым исходным кодом, такие как VinaLlama и Vistral, очень ценны для продвижения приложений ИИ во Вьетнаме.
«Эти модели с открытым исходным кодом также позволяют большему числу программистов и энтузиастов технологий получить доступ к сфере инженеров ИИ, имея всего лишь MacBook, вместо того, чтобы вкладывать средства в дорогостоящую инфраструктуру на базе графических процессоров (GPU). Это также будет способствовать развитию инженеров ИИ во Вьетнаме, чья профессия будет очень востребована в ближайшем будущем», — сказал г-н Лок.
По словам Куана, вьетнамцы обладают очень хорошей теоретической базой, хорошо разбираются в искусственном интеллекте, и в ChatGPT также есть сотрудники, участвующие в исследованиях, но им сложнее быстро поспевать за постоянно меняющейся волной технологий. «Вьетнамцам нужен опыт создания продуктов для конечных пользователей, чтобы по-настоящему понимать проблемы, с которыми они сталкиваются, и правильно направлять свои исследования», — объяснил Куан причину исследования бесплатных моделей искусственного интеллекта для поддержки вьетнамцев в сфере технологий. Он отметил, что сотрудничал со многими международными организациями и всегда готов к сотрудничеству с исследовательскими группами во Вьетнаме.
Нху Куинь
Ссылка на источник
Комментарий (0)