Модель R1-Omni от Alibaba может определить эмоциональное состояние человека по видео . Фото: Xpert.Digital . |
По данным Bloomberg , лаборатория Tongyi компании Alibaba 11 марта выпустила модель R1-Omni с открытым исходным кодом.
Наиболее примечательной особенностью этой модели является то, что она может делать выводы об эмоциональном состоянии человека на видео, а также описывать одежду и окружающую обстановку.
Это шаг вперед в области компьютерного зрения и усовершенствованная версия предыдущей модели HumanOmni с открытым исходным кодом, разработанной тем же главным исследователем Alibaba Цзясином Чжао. В частности, Alibaba публично выпустила R1-Omni для бесплатной загрузки на платформе Hugging Face.
Отчет об исследовании показывает, что R1-Omni может лучше понимать, как визуальная и слуховая информация поддерживает распознавание эмоций. Кроме того, чтобы улучшить распознавание эмоций как в визуальной, так и в звуковой модальностях, модель улучшает свои системы ИИ с помощью алгоритмов обучения с подкреплением.
Обучение с подкреплением — это тип процесса машинного обучения, который фокусируется на принятии решений автоматизированными агентами, включая передовое программное обеспечение на основе искусственного интеллекта, роботов и беспилотные автомобили.
Эти автоматизированные агенты учатся выполнять задачу методом проб и ошибок в отсутствие человеческого руководства. Эта техника является важным элементом в разработке модели ИИ, поскольку она решает последовательные проблемы принятия решений в неопределенной среде.
Результаты исследования показывают, что модель R1-Omni обладает более сильными способностями к рассуждению, пониманию и обобщению, чем другие модели.
Источник: https://znews.vn/ai-trung-quoc-doc-duoc-cam-xuc-con-nguoi-post1537948.html
Комментарий (0)