Покинув США и вернувшись домой, Нгуен Хоанг Куан и его коллеги из VILM разработали бесплатную систему искусственного интеллекта (ИИ), которую вьетнамцы могут использовать в сфере обслуживания клиентов. Ее скачивают более 100 000 раз в месяц.
В июне 2023 года 25-летний Нгуен Хоанг Куан и его коллеги 23-летний Фам Нхут Хуэй, инженер по искусственному интеллекту в ZaloAI, и 24-летний Дао Минь Зунг, аспирант Университета Корка (Ирландия), стали соучредителями некоммерческой организации VILM с целью помочь вьетнамцам опробовать самые передовые технологии искусственного интеллекта наиболее оптимальным способом.
После почти 6 месяцев исследований и практического применения команда успешно разработала три бесплатные модели ИИ, включая OpenHermes, VinaLlama и Vistral. Это основополагающие исследования для разработки систем ИИ, способных понимать желания пользователя и действовать в соответствии с ним (модель больших действий). Эти модели предназначены для применения в таких областях технологий, как управление машинами, робототехника для лучшей поддержки людей с ограниченными возможностями без помощи сиделок, помощь программистам в исправлении ошибок, виртуальные помощники для обслуживания клиентов и бесплатного задавания вопросов.
OpenHermes достигает 85 000 загрузок в месяц, входя в десятку самых скачиваемых языковых моделей на HuggingFace (крупнейшем в мире сайте для обмена моделями искусственного интеллекта). Скриншот
Модель OpenHermes — это крупная языковая модель, поддерживающая английский язык, как и ChatGPT, но с более высокими показателями. Пользователи могут загрузить модель на свои персональные компьютеры для использования без подключения к интернету. Примечательно, что данные для обучения OpenHermes составляют всего 1/100 от данных для обучения ChatGPT от OpenAI. В настоящее время это приложение получает более 50 000 загрузок в месяц. OpenHermes-2.5 и OpenHermes-2.5-Vision используются более чем 40 стартапами в Кремниевой долине (США).
VinaLlama и Vistral — это две языковые модели, ориентированные на вьетнамский рынок и призванные помочь отечественным пользователям легче освоить самые передовые технологии искусственного интеллекта.
Хоанг Цюань провёл 7 лет, обучаясь в США, и работал инженером-исследователем в OpenAI над моделью искусственного интеллекта ChatGPT, хотя и не окончил университет. В 2022 году он работал инженером по обработке данных в Microsoft и продукте Bing Chat от OpenAI, зарабатывая тысячи долларов. К 2023 году, столкнувшись с волной увольнений в сфере технологий в США, Цюань осознал, что рынок труда для выпускников вузов весьма неблагоприятен, но, увидев возможности трудоустройства во Вьетнаме, решил вернуться домой.
Нгуен Хоанг Куан. Фото: НВКК
В VILM Куан занимает должность главного инженера, отвечающего за исследования методов улучшения данных и обучения ИИ. Нхут Хюй отвечает за технические исследования в области обучения ИИ, а Минь Зунг предлагает новые методы в теоретических исследованиях.
Куан объяснил, что существующие крупные языковые модели, такие как ChatGPT (Large Language Model), могут обеспечивать только текстовый вывод, в то время как у людей есть множество способов общаться и получать знания. Именно поэтому команда стремится создать систему, способную гибко работать с различными типами ввода и вывода (получать и выводить данные, такие как язык, изображения, видео , звуки), а не ограничиваться только уровнем языка.
Чтобы достичь цели создания крупных моделей действий, команде пришлось решить две проблемы: безопасность и скорость. Современные приложения ИИ в основном используют пользовательские данные и отправляют их на серверы таких компаний, как OpenAI, для обработки, что вызывает опасения по поводу безопасности. Команда сосредоточилась на создании моделей ИИ, которые были бы достаточно компактными и быстрыми для обработки непосредственно на мобильных устройствах, при этом обеспечивая баланс между производительностью и скоростью, чтобы не влиять на пользовательский опыт.
Экспериментальная группа использовала данные, полученные от ИИ, для обучения самого ИИ, вместо того, чтобы пойти по пути использования данных из реальных источников. Поначалу у них возникли трудности с поиском вычислительных ресурсов (компьютеров для обучения ИИ), но позже им удалось убедить крупные компании и лаборатории по всему миру стать спонсорами.
Куан заявил, что главная цель создания этих продуктов — предоставить пользователям быстрый доступ к приложениям ИИ с качеством, не уступающим ChatGPT или Bing Chat, а также упростить исследования и создание моделей ИИ в будущем. Вместо использования ChatGPT, ограниченного вьетнамским языком и культурой, вьетнамские компании могут скачать VinaLlama на вьетнамском языке.
Языковая модель VinaLlama легко решает математическую задачу на вьетнамском языке. На изображении представлена демонстрация решения математической задачи продуктом VinaLlama. Скриншот.
Г-н Данг Хай Лок, основатель платформы для создания чат-ботов на основе искусственного интеллекта Mindmaid, отметил, что, с точки зрения разработчика ИИ-приложений, он понимает, что стоимость и конфиденциальность данных — два вопроса, которые больше всего беспокоят компании при развертывании ИИ-приложений. Наиболее приемлемым решением этой проблемы являются модели LLM с открытым исходным кодом, которые могут работать на корпоративной инфраструктуре и изучать (тонко настраивать) больше собственных данных предприятия. Поэтому вьетнамские модели LLM с открытым исходным кодом, такие как VinaLlama и Vistral, очень ценны для продвижения ИИ-приложений во Вьетнаме.
«Эти модели с открытым исходным кодом также позволяют большему числу программистов и энтузиастов технологий получить доступ к сфере инженеров ИИ, имея всего лишь MacBook, вместо того, чтобы вкладывать средства в дорогостоящую инфраструктуру GPU (видеокарт). Это также будет способствовать развитию инженеров ИИ во Вьетнаме, чья профессия будет очень востребована в ближайшем будущем», — сказал г-н Лок.
По словам Куана, вьетнамцы обладают очень хорошей теоретической базой, хорошо разбираются в искусственном интеллекте, и в ChatGPT также есть специалисты, участвующие в исследованиях, но им сложнее быстро поспевать за постоянно меняющейся волной технологий. «Вьетнамцам нужен опыт создания продуктов для конечных пользователей, чтобы по-настоящему понимать проблемы, с которыми они сталкиваются, и правильно направлять свои исследования», — объяснил Куан причину исследования бесплатных моделей искусственного интеллекта для поддержки вьетнамцев в сфере технологий. Он отметил, что сотрудничал со многими международными организациями и всегда готов к сотрудничеству с исследовательскими группами во Вьетнаме.
Нху Куинь
Ссылка на источник










Комментарий (0)