Meta выпускает модель ИИ, которая может «самообучаться» и «саморазвиваться»

(CLO) Meta, материнская компания Facebook, объявила в пятницу о запуске серии новых моделей ИИ, включая «Самообучающийся оценщик», который может сократить вмешательство человека в процесс разработки ИИ.

Объявление было сделано после того, как Meta представила инструмент в исследовательской статье в августе, описав, как он использует метод «цепочки мыслей», аналогичный новым моделям OpenAI, для вынесения точных суждений о реакциях моделей ИИ. Этот метод разбивает сложные задачи на более простые логические шаги, помогая повысить точность в таких областях, как наука , программирование и математика.

модель мета-релиза, которая может самостоятельно учиться и саморазвиваться, модель 1 — Значок Meta AI. Фото: Reuters

Для обучения этой рейтинговой модели исследователи использовали исключительно данные, сгенерированные искусственным интеллектом, полностью исключив вмешательство человека на этом этапе.

По словам двух исследователей Meta, возможность использования ИИ для оценки самого ИИ демонстрирует потенциал для разработки автономных агентов ИИ, которые могут учиться на собственных ошибках.

Многие эксперты в области искусственного интеллекта рассматривают этих интеллектуальных цифровых агентов как цифровых помощников, способных выполнять различные задачи без вмешательства человека.

Самосовершенствующиеся модели могут устранить необходимость в процессе «обучения с подкреплением на основе обратной связи с человеком», который требует высококвалифицированных экспертов для маркировки данных и проверки точности сложных математических и письменных ответов. В настоящее время этот процесс очень дорогой и неэффективный.

«Мы надеемся, что по мере того, как ИИ будет все больше превосходить людей, он станет лучше проверять свою собственную работу и даже превзойдет человеческий уровень мастерства», — сказал Джейсон Уэстон, один из исследователей проекта.

«Способность к обучению и самооценке является ключом к развитию ИИ до сверхчеловеческого уровня», — добавил он.

Помимо Meta, исследования концепции RLAIF (или «обучения с подкреплением на основе обратной связи с искусственным интеллектом») опубликовали и другие компании, такие как Google и Anthropic. Однако, в отличие от Meta, эти компании редко публикуют свои модели для публичного использования.

Као Фонг (по данным Reuters)

Источник: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html