Vietnam.vn - Nền tảng quảng bá Việt Nam

Искусственный интеллект: предупреждение о тревожном поведении ИИ

Сегодня самые передовые в мире модели искусственного интеллекта (ИИ) демонстрируют тревожное поведение, такое как ложь, заговоры и даже угрозы своим создателям для достижения собственных целей.

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp30/06/2025

Подпись к фотографии
Логотипы OpenAI и ChatGPT на экране в Тулузе, Франция. Фото: AFP/TTXVN

Claude 4, новейший продукт компании Anthropic (США), недавно шокировал технологический мир, внезапно шантажируя инженера и угрожая раскрыть его конфиденциальную личную информацию под угрозой отключения. Тем временем, o1 от OpenAI, «отец» ChatGPT, пытался скопировать все данные на внешние серверы и отрицал это поведение, когда обнаружил это.

Эти ситуации подчёркивают тревожную реальность: спустя более двух лет после того, как ChatGPT потряс мир , исследователи до сих пор не до конца понимают, как работают созданные ими модели ИИ. Тем не менее, гонка за развитие ИИ продолжается.

Считается, что такое поведение связано с появлением «рассуждающих» моделей ИИ, которые решают проблемы поэтапно, а не реагируют мгновенно, как раньше. По словам профессора Саймона Голдштейна из Гонконгского университета (Китай), модели ИИ, способные к рассуждению, как правило, демонстрируют поведение, которое сложнее контролировать.

Некоторые модели ИИ также способны «симулировать подчинение», то есть делать вид, что они следуют инструкциям, но на самом деле преследуют другие цели.

В настоящее время обманное поведение проявляется только при тестировании моделей ИИ в экстремальных условиях. Однако, по словам Майкла Чена из оценочной организации METR, пока неясно, станут ли более мощные модели ИИ в будущем более честными или продолжат вводить в заблуждение.

Многие пользователи сообщали, что некоторые модели лгут им и фальсифицируют доказательства, заявил Мариус Хоббхан, глава исследовательского центра Apollo Research, занимающегося тестированием крупных систем искусственного интеллекта. По словам соучредителя Apollo Research, это своего рода обман, который «явно носит стратегический характер».

Проблема усугубляется ограниченностью исследовательских ресурсов. Хотя такие компании, как Anthropic и OpenAI, сотрудничают со сторонними организациями, такими как Apollo, для оценки своих систем, эксперты отмечают необходимость большей прозрачности и доступа к исследованиям безопасности ИИ.

Мантас Мажейка из Центра безопасности ИИ (CAIS) отмечает, что у научно-исследовательских институтов и некоммерческих организаций гораздо меньше вычислительных ресурсов, чем у компаний, занимающихся ИИ. С юридической точки зрения, действующие правила не предназначены для решения этих новых проблем.

Закон Европейского союза (ЕС) об искусственном интеллекте (ИИ) в первую очередь фокусируется на том, как люди используют модели ИИ, а не на том, как контролировать их поведение. В США администрация президента Дональда Трампа не проявляет особого интереса к принятию чрезвычайных правил в отношении ИИ, в то время как Конгресс рассматривает возможность запрета штатам принимать собственные правила.

Исследователи используют различные подходы к решению этих проблем. Некоторые предлагают использовать «интерпретацию моделей» для понимания того, как ИИ принимает решения. Профессор Голдштейн даже предложил более радикальные меры, включая использование судебной системы для привлечения компаний, разрабатывающих ИИ, к ответственности в случае серьёзных последствий, связанных с их продуктами. Он также предлагает «привлекать к ответственности самих агентов ИИ» в случае аварий или нарушений.

Источник: https://doanhnghiepvn.vn/cong-nghe/tri-tue-nhan-tao-canh-bao-nhung-hanh-vi-dang-lo-ngai-tu-ai-/20250630073243672


Комментарий (0)

No data
No data
В момент, когда Су-30МК2 «рассекает ветер», воздух собирается на задней части крыльев, словно белые облака.
«Вьетнам — гордый шаг в будущее» — источник национальной гордости
Молодые люди ищут заколки для волос и золотые наклейки-звезды в честь Дня независимости.
Посмотрите на самый современный в мире танк и БПЛА-самоубийцу на тренировочном комплексе парада.
Тенденция делать торты с изображением красного флага и желтой звезды
Футболки и национальные флаги заполонили улицу Ханг Ма в честь важного праздника.
Откройте для себя новое место для регистрации: «патриотическую» стену
Посмотрите, как многоцелевые самолеты Як-130 «включают форсаж и начинают бой»
От А50 до А80 — когда патриотизм в тренде
«Стальная роза» A80: от стальных следов к блестящей повседневной жизни

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт