Вышеуказанный комментарий был сделан г-ном Нгуеном Ким Анем, директором по продуктам (CPO) компании VinBigdata, в ходе беседы с VietNamNet о вьетнамской языковой модели, об успешной разработке которой компания VinBigdata объявила 21 августа. VietNamNet хотел бы направить читателям содержание этого интервью.
Можете ли вы рассказать нам о текущем применении ИИ во Вьетнаме?
Г-н Нгуен Ким Ань: «AI» — одно из самых популярных ключевых слов в мире за последние годы. Во Вьетнаме мы также обсуждали эту тему на многих различных форумах. Однако реальность показывает, что внедрение ИИ во Вьетнаме по-прежнему сталкивается со многими проблемами, такими как ограниченность ресурсов, инфраструктуры, специализированных человеческих ресурсов и т. д.
В отчете по индексу готовности к внедрению искусственного интеллекта (ИИ) за 2022 год показано, что Вьетнам занимает 55-е место в мире, Сингапур — 2-е место, Малайзия — 29-е место, а Таиланд — 31-е место. Видно, что Вьетнаму по-прежнему необходимо проявлять большую решительность в продвижении исследований и применения ИИ.
Я думаю, что у нас есть много преимуществ в использовании кратчайших путей, поскольку во Вьетнаме молодая рабочая сила с очень хорошей базой в области математики и инженерии. Это важное преимущество, которое следует усвоить. Я верю, что при поддержке и сотрудничестве со стороны правительства и бизнеса мы быстро реализуем потенциал развития индустрии ИИ и внесем вклад в социально-экономическое развитие страны.
Почему VinBigdata решила разработать недавно запущенную модель вьетнамского языка?
Г-н Нгуен Ким Ань: Крупные языковые модели являются прочной основой для появления продуктов приложений ИИ, таких как ChatGPT от Open AI или Bard от Google. Однако для товаров из-за рубежа вьетнамский язык не входит в основную языковую группу. Это в той или иной степени влияет на качество контента, возвращаемого пользователям.
Если вы запросите подробную информацию, касающуюся конкретно вьетнамцев, вероятность ошибки довольно высока. А если серьезно, то если пользователи будут использовать этот инструмент для поиска информации и обновления новостей, в будущем это может привести к таким последствиям, как искажение базовых знаний части вьетнамцев, особенно молодежи.
Поэтому создание большой модели вьетнамского языка необходимо для разработки подходящих продуктов и наилучшего удовлетворения потребностей вьетнамского народа. С первых дней своего создания компания VinBigdata определила «данные» как основной и наиболее важный фактор для исследования и запуска продуктов ИИ для обслуживания рынка.
Это также причина, по которой мы можем стать пионерами в скорейшем завершении создания большой модели вьетнамского языка. Вместо того чтобы использовать до 175 миллиардов параметров, как в ChatGPT, нам нужно всего несколько миллиардов параметров. Это имеет не только прикладное значение, но и значимо для общества, поскольку все больше людей используют искусственный ИИ в качестве инструмента для учебы, работы, поиска информации...
Как VinBigdata будет применять недавно анонсированную модель вьетнамского языка, сэр?
Г-н Нгуен Ким Ань: Полное освоение технологии, саморазвитие с первых шагов, успешное создание крупной модели вьетнамского языка считаются важным шагом на пути к тому, чтобы помочь VinBigdata внедрить технологию генеративного ИИ в экосистему продуктов и услуг, которые были и будут предоставлены на рынке.
Мы наметили конкретную дорожную карту для внедрения результатов исследований в практику. В частности, VinBigdata представит потребителям две версии приложения: первую для предприятий и вторую для сообщества.
В корпоративной версии VinBigdata интегрирует технологии, которые сделают VinBase (комплексную мультикогнитивную платформу искусственного интеллекта) первой платформой генеративного ИИ во Вьетнаме, а также предложат решения для разработки на основе технологии генеративного ИИ, такие как чат-бот генеративного ИИ, бот-звонок или виртуальный помощник нового поколения ViVi...
Эта технология поможет повысить естественность машинного общения, одновременно помогая пользователям искать и синтезировать информацию гораздо быстрее и проще, чем раньше.
В настоящее время VinBigdata впервые успешно применила новую технологию в линейке продуктов VinBase KB (портал базы знаний VinBase). Продукт способен извлекать информацию и автоматически генерировать ответы на основе информации, собранной из чрезвычайно больших наборов данных в системе знаний.
По нашему плану, к концу декабря 2023 года VinBigdata запустит продукт ViGPT — «вьетнамскую версию ChatGPT», открытую для доступа и тестирования сообществом совершенно бесплатно. С помощью ViGPT пользователи могут задавать вопросы и отвечать на вопросы, касающиеся информации, касающейся Вьетнама (нормативные акты, юридические документы и т. д.), или информации особого характера (история, география, литература и т. д.).
Это проект, имеющий огромное значение для сообщества и общества в целом, который, как ожидается, станет полезным инструментом, эффективно поддерживающим вьетнамцев в процессе учебы и работы.
Намерена ли VinBigdata поделиться этой большой моделью вьетнамского языка с заинтересованными сторонами?
Г-н Нгуен Ким Ань: Успешное создание крупной модели вьетнамского языка имеет значение не только для VinBigdata, но и для общества и научно-технического сообщества Вьетнама. Платформа VinBase интегрирована с генеративным ИИ, что позволяет компаниям в полной мере использовать эту базовую технологию для применения к собственным фирменным продуктам.
VinBigdata надеется, что с помощью этой модели у вьетнамских предприятий появится больше возможностей получить доступ к технологиям искусственного интеллекта для создания или наследования достижений разработанной нами модели вьетнамского языка.
Кроме того, благодаря ViGPT вьетнамцы получат свою собственную «вьетнамскую версию ChatGPT», с помощью которой они смогут легко, быстро, точно и надежно искать источники информации.
Безопасность и авторские права являются важными факторами при разработке генеративного ИИ. Как VinBigdata справилась с этой проблемой, сэр, с недавно запущенной вьетнамской языковой моделью?
Г-н Нгуен Ким Ань: Как исследовательское подразделение по большим данным и искусственному интеллекту, VinBigdata всегда уважает безопасность данных, выстраивая строгие процессы и строго соблюдая правила безопасности данных. В частности, для обеспечения прав пользователей VinBigdata старается обеспечить прозрачность процесса сбора и использования данных, особенно персональных данных.
В то же время мы всегда активно разрабатываем многоуровневые меры безопасности, строгие процессы контроля жизненного цикла данных и соответствующую авторизацию использования данных (кто имеет право доступа и использования каких данных?) для предотвращения утечки информации. В мире и во Вьетнаме существуют правила и стандарты безопасности данных, и VinBigdata всегда соблюдает эти принципы.
Кроме того, вопрос авторских прав также стал довольно болезненной темой в связи с бурным развитием искусственного интеллекта в последнее время. Понимая это, VinBigdata фокусируется на разработке продуктов в направлении предоставления конкретной, локализованной и специфичной для Вьетнама информации в каждой конкретной области, а не на ее распространении во избежание дезинформации.
Благодаря этой изначальной ориентации VinBigdata может уверенно создавать продукты, которые предоставляют более точные знания, чем ChatGPT в определенных специализированных областях, таких как финансы и банковское дело, юриспруденция, медицина и т. д., а также с информацией, которая является исконно вьетнамской, например, по истории, географии, литературе и т. д.
Как вы считаете, настало ли время применять ИИ на практике во Вьетнаме?
Г-н Нгуен Ким Ань: Я думаю, нам нужно еще больше ускориться в гонке за искусственный интеллект. Потому что крупнейшие страны и корпорации мира уже на определенное расстояние опережают нас.
В настоящее время можно сказать, что Вьетнам пока не слишком активно применяет ИИ на практике и находится только на начальной стадии.
Однако я считаю, что благодаря усилиям и сотрудничеству на всех уровнях в сочетании с высококвалифицированными кадрами в области искусственного интеллекта во Вьетнаме сегодня мы можем воспользоваться возможностью и сделать скачок!
Источник
Комментарий (0)