Вышеуказанный комментарий был сделан г-ном Нгуеном Ким Анем, директором по продуктам (CPO) компании VinBigdata, в ходе беседы с VietNamNet о вьетнамской языковой модели, об успешной разработке которой компания VinBigdata объявила 21 августа. VietNamNet хотел бы предоставить читателям содержание этого интервью.
Можете ли вы рассказать нам о текущем применении ИИ во Вьетнаме?
Г-н Нгуен Ким Ань: ИИ — одно из самых популярных ключевых слов в мире в последние годы. Во Вьетнаме мы также обсуждали эту тему на различных форумах. Однако реальность показывает, что внедрение ИИ во Вьетнаме по-прежнему сталкивается с множеством проблем, таких как ограниченность ресурсов, инфраструктуры, профессиональных кадров и т. д.
Согласно отчёту «Индекс готовности к развитию искусственного интеллекта (ИИ) за 2022 год», Вьетнам занимает 55-е место в мире, Сингапур — 2-е, Малайзия — 29-е, а Таиланд — 31-е. Из этого следует, что Вьетнаму всё ещё необходимо более решительно продвигать исследования и применение ИИ.
Я думаю, что у нас есть множество преимуществ в использовании кратчайших путей, поскольку во Вьетнаме есть молодые специалисты с очень хорошей базой в области математики и инженерии. Это важное преимущество, которым необходимо воспользоваться. При поддержке и сотрудничестве со стороны правительства и бизнеса, я уверен, мы быстро реализуем потенциал развития индустрии ИИ, который внесет вклад в социально -экономическое развитие страны.
Почему компания VinBigdata решила заняться разработкой недавно запущенной модели вьетнамского языка?
Г-н Нгуен Ким Ань: Крупные языковые модели служат прочной основой для создания продуктов на базе ИИ, таких как ChatGPT от Open AI или Bard от Google. Однако для зарубежных продуктов вьетнамский язык не входит в основную языковую группу. Это в некоторой степени влияет на качество контента, предоставляемого пользователям.
Если вы запрашиваете подробную информацию, касающуюся вьетнамцев, вероятность ошибок довольно высока. Более того, если пользователи используют этот инструмент для поиска информации и обновления новостей, в будущем это может привести к таким последствиям, как неверные базовые знания части вьетнамцев, особенно молодёжи.
Таким образом, создание обширной модели вьетнамского языка необходимо для разработки подходящих продуктов и максимального удовлетворения потребностей вьетнамцев. С самого начала VinBigdata определила «данные» как основной и важнейший фактор для исследования и запуска продуктов на основе ИИ для удовлетворения потребностей рынка.
Именно поэтому мы можем стать пионерами в скорейшем завершении создания крупной модели вьетнамского языка. Вместо использования 175 миллиардов параметров, как в ChatGPT, нам достаточно всего нескольких миллиардов. Это важно не только с точки зрения практического применения, но и для общества, учитывая тенденцию к тому, что всё больше людей используют генеративный ИИ как инструмент для учёбы, работы и поиска информации...
Сэр, как VinBigdata будет применять недавно анонсированную модель вьетнамского языка?
Г-н Нгуен Ким Ань: Полное освоение технологии, саморазвитие с первых шагов, успешное создание крупной модели вьетнамского языка считается важным шагом на пути к тому, чтобы помочь VinBigdata внедрить технологию генеративного ИИ в экосистему продуктов и услуг, которые уже предоставлены и предоставляются на рынке.
Мы разработали конкретную дорожную карту для практического применения результатов исследования. В частности, VinBigdata представит потребителям две версии приложения: первую для бизнеса и вторую для сообщества.
В корпоративной версии VinBigdata интегрирует технологии, которые сделают VinBase (комплексную мультикогнитивную платформу искусственного интеллекта) первой платформой генеративного ИИ во Вьетнаме, а также предложат решения для разработки на основе технологии генеративного ИИ, такие как чат-бот генеративного ИИ, бот-звонок или виртуальный помощник нового поколения ViVi...
Эта технология поможет повысить естественность машинного общения, одновременно позволяя пользователям искать и синтезировать информацию гораздо быстрее и проще, чем раньше.
В настоящее время VinBigdata успешно применяет новую технологию в линейке продуктов VinBase KB (портал базы знаний VinBase). Продукт способен извлекать информацию и автоматически генерировать ответы на основе информации, собранной из чрезвычайно больших наборов данных в системе знаний.
Согласно нашему плану, к концу декабря 2023 года VinBigdata запустит продукт ViGPT — «вьетнамскую версию ChatGPT», которая будет доступна сообществу для бесплатного доступа и тестирования. С помощью ViGPT пользователи смогут задавать вопросы и отвечать на них, касающиеся информации, касающейся Вьетнама (нормативные акты, юридические документы и т. д.), а также информации специального характера (история, география, литература и т. д.).
Это проект, имеющий большое значение для сообщества и общества в целом, который, как ожидается, станет полезным инструментом, эффективно поддерживающим вьетнамцев в процессе учебы и работы.
Собирается ли VinBigdata поделиться этой большой моделью вьетнамского языка с заинтересованными сторонами?
Г-н Нгуен Ким Ань: Успешное создание крупной модели вьетнамского языка имеет значение не только для VinBigdata, но и для всего общества и научно- технического сообщества Вьетнама. Платформа VinBase интегрирована с генеративным искусственным интеллектом, что позволяет компаниям в полной мере использовать эту ключевую технологию для разработки собственных брендированных продуктов.
VinBigdata надеется, что с помощью этой модели у вьетнамских предприятий появится больше возможностей получить доступ к технологиям искусственного интеллекта для создания или наследования достижений разработанной нами модели вьетнамского языка.
Кроме того, благодаря ViGPT вьетнамцы получат собственную «вьетнамскую версию ChatGPT», с помощью которой они смогут легко, быстро, точно и надежно искать источники информации.
Безопасность и авторские права — важные факторы при разработке генеративного ИИ. Как VinBigdata справилась с этой проблемой, учитывая недавно запущенную модель вьетнамского языка?
Г-н Нгуен Ким Ань: VinBigdata, исследовательское подразделение, занимающееся большими данными и искусственным интеллектом, всегда соблюдает конфиденциальность данных, разрабатывая строгие процессы и неукоснительно соблюдая правила безопасности данных. В частности, для обеспечения прав пользователей VinBigdata стремится обеспечить прозрачность процесса сбора и использования данных, особенно персональных данных.
В то же время мы всегда активно работаем над созданием многоуровневых мер безопасности, строгих процессов контроля жизненного цикла данных и надлежащей авторизацией использования данных (кто имеет право доступа и использования каких данных?) для предотвращения утечек информации. Кроме того, в мире и во Вьетнаме действуют нормативные акты и стандарты безопасности данных, и VinBigdata всегда придерживается этих принципов.
Кроме того, вопросы авторского права стали довольно болезненной темой после бурного развития генеративного искусственного интеллекта в последнее время. Понимая это, VinBigdata фокусируется на разработке продуктов, направленных на предоставление конкретной, локализованной и специфичной для Вьетнама информации по каждой конкретной теме, а не на её разрозненность во избежание дезинформации.
Благодаря этой изначальной ориентации VinBigdata может уверенно создавать продукты, которые предоставляют более точные знания, чем ChatGPT в конкретных специализированных областях, таких как финансы и банковское дело, юриспруденция, медицина и т. д., а также с информацией, которая является исконно вьетнамской, например, по истории, географии, литературе и т. д.
Как вы считаете, настало ли время применять ИИ на практике во Вьетнаме?
Г-н Нгуен Ким Ань: Я думаю, нам необходимо ускориться в гонке за искусственный интеллект. Ведь крупнейшие страны и корпорации мира уже значительно нас опережают.
В настоящее время можно сказать, что Вьетнам пока не слишком активно применяет искусственный интеллект на практике и находится только на начальном этапе.
Однако я считаю, что благодаря усилиям и сотрудничеству на всех уровнях в сочетании с высококвалифицированными кадрами в области искусственного интеллекта во Вьетнаме сегодня мы можем воспользоваться возможностью и совершить скачок!
Источник
Комментарий (0)