Вышеприведенная информация была предоставлена ​​профессором Ву Ха Ваном, научным директором VinBigdata, в ходе обсуждения с журналистами в кулуарах недавнего запуска ViGPT.

anhvuhavan.jpg
Профессор Ву Ха Ван, главный научный сотрудник VinBigdata.

ViGPT нуждается в участии технических специалистов и сообщества.

Профессор Ву Ха Ван сказал, что для крупных компаний, таких как Google, при разработке больших языков они выберут английский или французский в качестве основного языка. Хотя есть еще вьетнамский, результаты поиска или подстановки будут относительно медленными по сравнению с другими языками. В некоторой степени ответы этих больших языковых моделей на вопросы из вьетнамского языка не будут полными и точными.

Поэтому VinBigdata надеется, что со временем ViGPT превзойдет их по точности в вопросах, напрямую связанных с культурой, историей, географией и т. д., информацией, которая является специфичной для вьетнамского народа. Это то, чего хотят и к чему стремятся создатели вьетнамской языковой модели в будущем, задавая вопросы о вьетнамцах, это будет лучшим источником сравнения, чем иностранные.

Если углубляться, директор по науке VinBigdata проанализировал, например, вопрос в «чувствительный» политический период об истории Truong Sa и Hoang Sa, нам очень сложно гарантировать, что ответ от Google или OpenAI не будет нести в себе политическую предвзятость основателей или стоящих за этими компаниями. Здесь у нас есть другие варианты во Вьетнаме, было бы лучше, если бы мы подумали об этом вопросе.

«Целью создания большой языковой модели для вьетнамцев является предоставление вьетнамцам наилучших ответов, мы не можем знать их цели», — поделился профессор Ву Ха Ван.

Признавая, что есть много вещей, которые ViGPT в настоящее время не может делать так же хорошо, как ChatGPT или Google Bard, потому что уровень инвестиций этих компаний и время, которое они тратят на их реализацию, в тысячи раз выше. Однако профессор Ву Ха Ван сказал, что на некоторые вопросы, которые предвзяты в отношении Вьетнама, такие как «Чей флаг вышит шестью золотыми иероглифами?», ViGPT ответит, что это флаг Тран Куок Тоана, в то время как другие версии могут быть неверными. В будущем, с углубленными вопросами, такими как этот, ViGPT будет работать лучше, если будет обратная связь от внутренних пользователей.

«Если пользователи только критикуют или думают, что эта большая языковая модель все еще глупа, когда мой 10-летний ребенок знает вопросы, которые он не знает, или задает вопросы с подвохом, чтобы доказать, что мы умнее ИИ. Мы умнее ИИ, но это не для какой-либо цели, здесь мы не делаем продукт лучше, а делаем людей, которые делают продукт, грустнее. Поэтому VinBigdata нуждается в общем вкладе технических специалистов и сообщества, нам нужно товарищество вьетнамцев в совершенствовании продукта, чтобы он был не просто простым инструментом обслуживания, но и гордостью вьетнамского народа», - подчеркнул профессор Ву Ха Ван.

Готовы поддержать и сопровождать вьетнамскую языковую модель

В беседе с VietNamNet представители стартапов, работающих в сфере искусственного интеллекта во Вьетнаме, заявили, что готовы поддержать и сопровождать вьетнамскую языковую модель VinBigdata.

ViGPT.jpg
Поддержка и сопровождение ViGPT необходимы для разработки крупной модели вьетнамского языка.

Г-н Динь Тран Туан Линь, технический директор Unikon Joint Stock Company, владельца платформы Aicontent.vn, сказал, что в настоящее время не так много стран в Азии предприняли усилия по успешному обучению собственных крупных языковых моделей, лидерами являются Китай, Корея, Япония... Поэтому ViGPT является важным сигналом для усилий вьетнамского народа по инвестированию в основные технологии. По словам г-на Динь Тран Туан Линь, любое путешествие в тысячу миль должно начинаться с первых шагов, как пионер в области применения ИИ, Unikon готов участвовать в содействии, тестировании, предоставлении отзывов и даже использовании ViGPT в некоторых подходящих масштабных проектах.

Между тем, г-н Данг Хуу Сон, соучредитель Lovinbot, сказал, что прислушивание VinBigdata к сообществу и комментариям экспертов — это очень хорошая вещь для разработки большой языковой модели специально для вьетнамцев. Как технический специалист, г-н Данг Хуу Сон также дал обратную связь технической команде VinBigdata после использования продукта.

По словам г-на Данг Хуу Сона, недавно запущенный продукт не может быть завершен немедленно, но он также не может получить полную поддержку сообщества сразу, потому что вьетнамцы долгое время думали, что Вьетнам не может сделать эту технологию, поэтому ему все еще нужно время. В то же время VinBigdata должна иметь конкретные инструкции о том, как сообщество может лучше поддерживать и сопровождать его.

Г-н Данг Ху Лок, основатель платформы Mindmaid, также поделился тем, что в настоящее время в мире очень мало стран, которые построили модель родного языка. Даже богатые страны с сильными информационными технологиями, такие как Индия, или страны с более высоким ВВП, чем Вьетнам, такие как Индонезия, Ближний Восток... не могут сделать это просто потому, что они этого хотят, потому что это также зависит от особенностей языка. Поэтому, с более широкой точки зрения, Вьетнам имеет стратегическое преимущество в построении модели родного языка, и это будет стратегическим преимуществом для вьетнамцев, чтобы конкурировать на мировом уровне.

По словам г-на Данг Хыу Лока, любые усилия по созданию большой вьетнамской языковой модели ценны и должны быть прокомментированы определенным образом, чтобы модель совершеннее с каждым днем, вместо того, чтобы использовать некоторые текущие недостатки, чтобы отрицать все усилия отечественных технологических подразделений. Вьетнамцы также должны широко распространять важность большой языковой технологии в эпоху ИИ и больше обсуждать, как ее применять для создания ценности для себя и вьетнамского бизнеса, вместо того, чтобы сравнивать большую вьетнамскую языковую модель с лучшими большими языковыми моделями в мире сегодня. Поскольку большой язык является общей технологией ИИ, он может не быть хорош в этой проблеме, но он подходит для других конкретных проблем. В частности, большая вьетнамская языковая модель будет иметь большее преимущество в проблемах, связанных с пониманием и генерацией вьетнамского языка.

Community ViGPT будет предоставлен бесплатно некоммерческим организациям . Community ViGPT будет предоставлен бесплатно компанией VinBigdata некоммерческим организациям. Однако организациям, использующим эту версию, придется платить за инфраструктурные расходы, такие как облако и другие ресурсы при развертывании.