Эту информацию предоставил профессор Ву Ха Ван, научный директор VinBigdata, во время интервью с журналистами в кулуарах недавней презентации ViGPT.
Для реализации проекта ViGPT необходимы вклады инженеров и сообщества.
Профессор Ву Ха Ван заявил, что крупные компании, такие как Google, при разработке основных языковых решений в первую очередь выбирают английский или французский, хотя вьетнамский язык также доступен. Однако результаты поиска и проверки информации обрабатываются относительно медленно по сравнению с другими языками. В определенной степени ответы, полученные с помощью этих основных языковых моделей на вопросы на вьетнамском языке, будут неполными и неточными.
Поэтому VinBigdata надеется, что со временем ViGPT превзойдет их по точности в отношении вопросов, непосредственно связанных с вьетнамской культурой, историей, географией и другой информацией, уникальной для вьетнамского народа. Именно к этому стремятся создатели вьетнамской языковой модели: при задавании вопросов, актуальных для вьетнамцев, это будет более надежным источником информации, чем иностранные источники.
Углубляясь в тему, главный научный сотрудник VinBigdata проанализировал, что, например, в политически «чувствительный» период, касающийся истории островов Спратли и Парасельских островов, очень сложно гарантировать, что ответы Google или OpenAI не будут политически предвзяты со стороны основателей или лиц, стоящих за этими компаниями. Здесь у нас есть другие варианты во Вьетнаме, и было бы лучше рассмотреть этот вопрос.
«Наша цель при создании крупномасштабной языковой модели для носителей вьетнамского языка — предоставить им наилучшие возможные ответы; мы не можем знать их намерения», — поделился профессор Ву Ха Ван.
Следует признать, что в настоящее время ViGPT во многих аспектах отстает от ChatGPT или Google Bard из-за значительно больших инвестиций и более длительного времени разработки. Однако профессор Ву Ха Ван отметил, что на некоторые вопросы, связанные с Вьетнамом, например, «Чей флаг украшен шестью золотыми иероглифами?», ViGPT правильно определяет его как принадлежащий Чан Куок Тоану, в то время как другие варианты могут быть неверными. В будущем ViGPT будет показывать лучшие результаты при решении более сложных вопросов подобного рода, если будет учитываться обратная связь от отечественных пользователей.
«Если пользователи только критикуют или утверждают, что эта большая языковая модель по-прежнему очень глупа, потому что не знает ответов на вопросы, на которые способен даже 10-летний ребенок, или задают каверзные вопросы, чтобы доказать, что мы умнее ИИ, то мы действительно умнее ИИ, но это бесполезно. Здесь мы не улучшаем продукт, а огорчаем тех, кто его создал. Именно поэтому VinBigdata нуждается в коллективном вкладе инженеров и сообщества. Нам нужна поддержка вьетнамцев в совершенствовании продукта, чтобы он стал не просто инструментом, а источником гордости для вьетнамского народа», — подчеркнул профессор Ву Ха Ван.
Готовы поддержать и сотрудничать с вьетнамской моделью распространения широкого спектра языков.
В беседе с VietNamNet представители стартапов в области искусственного интеллекта во Вьетнаме заявили о готовности поддержать и сотрудничать с компанией VinBigdata в разработке модели обработки больших данных по вьетнамскому языку.
Г-н Динь Чан Туан Линь, технический директор корпорации Unikon, владельца платформы Aicontent.vn, заявил, что в настоящее время не многие страны Азии успешно обучили собственные крупномасштабные языковые модели. Лидерами в этом направлении являются Китай, Южная Корея и Япония. Поэтому ViGPT является важным сигналом инвестиций Вьетнама в ключевые технологии. По словам г-на Динь Чан Туан Линя, любое путешествие в тысячу миль начинается с первого шага. Будучи новаторской компанией в области применения ИИ, Unikon готова участвовать в разработке, тестировании, предоставлении обратной связи и даже экспериментальном использовании ViGPT в проектах соответствующего масштаба.
Между тем, г-н Данг Хуу Сон, соучредитель Lovinbot, считает, что готовность VinBigdata прислушиваться к отзывам сообщества и экспертов очень воодушевляет на разработку большой языковой модели, специально предназначенной для вьетнамцев. Как технический специалист, г-н Данг Хуу Сон также предоставил обратную связь технической команде VinBigdata после использования продукта.
По словам г-на Данг Хуу Сона, новый продукт невозможно довести до совершенства сразу, и он не может сразу получить полную поддержку сообщества. Это связано с тем, что вьетнамцы долгое время не верили в способность Вьетнама развивать подобные технологии, поэтому для этого еще нужно время. Кроме того, VinBigdata нуждается в конкретных рекомендациях о том, как сообщество может лучше поддерживать и сотрудничать с ними.
Г-н Данг Хуу Лок, основатель платформы Mindmaid, также отметил, что лишь немногие страны мира создали масштабную модель использования родного языка. Даже богатые страны с развитой инфраструктурой информационных технологий, такие как Индия, или страны с более высоким ВВП, чем у Вьетнама, такие как Индонезия и страны Ближнего Востока, не могут просто так это сделать, поскольку это зависит от особенностей языка. Поэтому, в более широком смысле, Вьетнам обладает стратегическим преимуществом в создании масштабной модели использования родного языка, и это станет стратегическим преимуществом для вьетнамцев в конкуренции на мировом уровне.
По словам г-на Данг Хуу Лока, любые усилия по созданию крупномасштабной модели вьетнамского языка ценны и требуют целенаправленной обратной связи для ежедневного совершенствования, вместо того чтобы зацикливаться на текущих недостатках и обесценивать усилия отечественных технологических компаний. Вьетнамцам также следует шире распространять информацию о важности крупномасштабных языковых технологий в эпоху ИИ и больше обсуждать, как их применять для создания ценности и развития собственного бизнеса, вместо того чтобы сравнивать вьетнамскую крупномасштабную языковую модель с лучшими крупномасштабными языковыми моделями в мире сегодня. Поскольку крупномасштабные языковые модели представляют собой универсальную технологию (общий ИИ), они могут быть неэффективны в решении одной задачи, но пригодны для другой. В частности, вьетнамская крупномасштабная языковая модель будет иметь больше преимуществ в задачах, связанных с пониманием и генерацией вьетнамского языка.
Источник








