Базирующаяся в Хельсинки компания Silo AI в среду запустит инициативу по созданию новых крупных языковых моделей, лежащих в основе таких общих продуктов ИИ, как ChatGPT от OpenAI и Bard от Google, на европейских языках, включая шведский, исландский, норвежский и датский.
Исследователи пытаются создать чат-ботов на основе искусственного интеллекта, которые хорошо реагируют на языках, отличных от английского. Фото: FT
Финская компания и другие команды работают над совершенствованием технологии чат-бота, который дает реальные ответы на текстовые вопросы на таких языках, как немецкий, иврит и арабский.
Эти шаги предпринимаются в то время, когда компании по всему миру начинают внедрять программное обеспечение на основе искусственного интеллекта, разработанное OpenAI, что побуждает критиков выражать обеспокоенность по поводу чрезмерной зависимости от мощной закрытой технологии, созданной небольшой группой преимущественно американских участников.
Bard от Google в настоящее время работает только на английском языке. ChatGPT от OpenAI поддерживает десятки языков, включая европейские языки, хинди, фарси и другие. Но, по словам людей, которые его всесторонне тестировали, он не одинаково точен для всех языков.
Silo AI пытается решить эту проблему, собрав команду опытных ученых в области ИИ со всей Европы. Они будут строить, обучать и запускать скандинавские модели на самом мощном суперкомпьютере континента LUMI, расположенном в Финляндии и модифицированном для запуска общего программного обеспечения ИИ.
Инициатива группы под названием SiloGen со временем планирует расшириться на большее количество языков.
Однако проблема не только лингвистическая. По словам Сарлина, создание моделей в Европе может гарантировать качество данных, используемых для обучения, и представлять культуру и этику стран за пределами США, включая вопросы конфиденциальности.
Модель Silo AI также будет иметь открытый исходный код, что означает, что ее может анализировать и настраивать любой, кто захочет ее развернуть. Это контрастирует с закрытыми моделями OpenAI и Google.
Другие европейские усилия включают OpenGPT-X и LEAM, обе инициативы под руководством Германии по разработке моделей языка с открытым исходным кодом. Модели OpenGPT-X создаются совместно с немецким стартапом ИИ Aleph Alpha.
Когда в прошлом году проект был запущен, группа, стоящая за OpenGPT-X, предупредила, что отсутствие доступа к подробной информации из таких моделей, как GPT-4, ставит под угрозу «цифровой суверенитет и рыночную свободу» Европы в области ИИ, что может помешать развитию европейских компаний и исследований.
Марко Тромбетти, генеральный директор итальянской компании цифрового перевода Translated, заявил, что ведущие чат-боты запрограммированы на предоставление наилучших результатов на английском языке, что «несправедливо по отношению к остальному миру».
Чтобы бороться с этим, его компания создала инструмент живого перевода для ChatGPT, который работает на 60 языках и направлен на улучшение ответов инструмента.
Подобные опасения высказываются не только в Европе. Израильское управление инноваций выделило 7,5 млн шиллингов (около 2,1 млн долларов США) на создание Консорциума по обработке естественного языка. Исполнительный директор группы Дрор Бин заявил, что она пытается обратить вспять «плохое и неадекватное качество распознавания ивритской и арабской речи в различных типах компьютерных систем».
Бин сказал, что из-за ограниченного финансирования исследований ИИ в арабоязычных странах и относительно небольшого количества носителей иврита в мире существуют опасения, что они останутся позади, поскольку продукты ИИ интегрируются в коммерческие приложения, такие как Microsoft Office и Google Workspace.
Май Ань (по данным FT, AP)
Источник
Комментарий (0)