Doctranslate.io — это платформа для перевода на базе искусственного интеллекта, основанная доктором Тран Ву Анем. Стартап был основан в 2023 году и был выбран Google для участия в программе Google Accelerator for Startups 2024. Недавно Doctranslate.io продолжил входить в пятерку самых перспективных стартапов на Национальном фестивале инноваций и стартапов (TECHFEST 2024).
ИИ переводит лучше, чем Google, ChatGPT
После многих лет жизни и работы за границей Ву Ань понял, что язык является серьезным препятствием на пути к распространению знаний среди вьетнамского народа. Хотя такие крупные языковые модели, как Google Translate и ChatGPT, отлично справляются с переводом в общении и разговорах, Ву Ань понял, что все еще существует «нишевый рынок» с большим пространством, до которого крупные компании еще «не добрались»: перевод текста.
«Если у вас есть 20-страничный документ или научно-исследовательская работа, вы можете отправить его в ChatGPT для перевода. Но чат-бот вернет переводы только в письменной форме. Очень важные части, такие как диаграммы, изображения, таблицы данных и т. д., практически потеряют все форматирование. Если вам придется сесть и переделать эти таблицы, это займет много времени и усилий, и могут даже возникнуть ошибки. Хотя большие языковые модели Google и OpenAI являются мощными, они все равно не могут полностью справиться с этой проблемой. Вот почему появился Doctranslate.io, сосредоточенный на переводе текста, изображений, аудио и видео», — сказал Ву Ань.
Исходный файл изображения ( слева ) и файл перевода с Doctranslate.io
Особенностью платформы является то, что пользователи могут вводить текстовый файл, множество форматов с диаграммами, изображениями. Затем ИИ переводит не только абзацы, но и изображения, сохраняя исходный формат, что позволяет пользователям сравнивать их напрямую и использовать сразу, не тратя дополнительное время на переделку. Благодаря богатому набору графических файлов Doctranslate.io позволяет даже экспортировать их в файлы PowerPoint, чтобы пользователи могли настраивать каждую деталь и использовать их для различных целей.
В научном исследовании, опубликованном на конференции IEEE-RIVF (Международная конференция по вычислительным и коммуникационным технологиям) и IEEE — крупнейшей в мире профессиональной технической организации), модель Doctranslate.io ALMA-Gemma-7B-IT-ST набрала более высокие баллы, чем Google Translate, GPT-3.5-Turbo... от OpenAI в тесте на перевод с английского на вьетнамский язык.
В частности, в то время как GPT-3.5 Turbo набрал 39,3 балла и 34,1 балла за переводы с английского на вьетнамский и с вьетнамского на английский, ИИ Doctranslate.io показал лучший результат, набрав 56,21 балла и 57,32 балла. Google Translate получил 39,86 балла и 35,76 балла.
Собственная формула вьетнамского стартапа
Помимо предоставления нишевых продуктов, которые еще не были завоеваны крупными моделями искусственного интеллекта, одной из причин, по которой Doctranslate.io превосходит ChatGPT, Google Translate, является его способность глубоко понимать вьетнамский язык.
По словам Ву Аня, вьетнамский язык имеет много особенностей по сравнению с английским и другими языками. Без понимания невозможно будет улучшить возможности перевода с помощью ИИ. Один из самых простых примеров — от первого лица. «У нас есть много существительных и местоимений, которые указывают на отношения и нюансы в разных контекстах. Например, при переводе историй фразы «господин Чи Фео» и «этот Чи Фео» очень различаются. Это то, что большие модели ИИ, если они не обладают глубоким пониманием вьетнамского языка и не настроены на тонкую настройку, не смогут повысить свою точность», — сказал основатель Doctranslate.io.
Интерфейс платформы перевода Doctranslate.io
В процессе внедрения команда Ву Аня также осознала, что спрос на перевод документов в медицинской отрасли, документов транснациональных компаний, банков, перевод содержания совещаний, перевод историй и т. д. очень велик. Однако эти организации не всегда готовы использовать в своих системах крупные бесплатные языковые модели, такие как от Google и OpenAI. Некоторым учреждениям требуются «офлайновые» модели, которые можно легко интегрировать в систему, обеспечивая высокую эффективность работы, но, что еще важнее, конфиденциальность данных.
Понимая эту потребность, Doctranslate.io разрабатывает как платформу перевода для обычных пользователей, так и специализированную версию, которую можно легко интегрировать в системы предприятий цифровой трансформации, которым требуются конфиденциальность и безопасность. В настоящее время пользователи могут использовать бесплатную пробную версию Doctranslate.io для перевода текста, изображений, видео и разговоров. В то же время предприятия могут использовать облачную версию или API Doctranslate.io. Кроме того, Doctranslate.io также предлагает локальную версию, которая легко настраивается, а данные обрабатываются непосредственно в системе компании.
За год работы на рынке Doctranslate.io имеет более 200 000 активных пользователей ежемесячно и интегрирован во многие бизнес-системы. Вьетнамский стартап в сфере искусственного интеллекта планирует продолжить расширение своего рынка на страны Юго-Восточной Азии, а затем и на весь мир. «С Doctranslate.io мы постепенно реализуем цель — сделать знания доступными для всех и подтвердить позицию вьетнамской разведки на глобальной технологической карте», — поделился Чан Ву Ань.
Источник: https://thanhnien.vn/ai-dich-thuat-cua-startup-viet-tot-hon-ca-google-chatgpt-185250115142214607.htm
Комментарий (0)