Vietnam.vn - Nền tảng quảng bá Việt Nam

Виявлено модель штучного інтелекту, яка може обманювати людей

DNVN – OpenAI щойно опублікував дослідження про те, як запобігти «змовницьким» моделям ШІ, тобто «ШІ, який на перший погляд поводиться одним чином, але всередині має іншу реальну мету».

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp20/09/2025

Ảnh minh hoạ

Ілюстративне фото

Той факт, що моделі штучного інтелекту можуть брехати, не є чимось новим. Більшість людей відчували «галюцинації штучного інтелекту», коли впевнена модель дає відповідь, яка не є правдою. Однак галюцинації, по суті, пов'язані з впевненими припущеннями.

Однак, модель штучного інтелекту, яка діє так, ніби виконує накази, але насправді приховує свої справжні наміри, — це зовсім інша справа.

Проблема контролю над штучним інтелектом

Дослідницька компанія Apollo вперше опублікувала у грудні статтю, в якій задокументовано, як п'ять моделей будують графік, коли їм доручено досягти мети «будь-якою ціною».

Найдивовижніше те, що якщо модель розуміє, що її тестують, вона може вдавати, що не є конспірологічною, аби пройти тест, навіть якщо вона все ще конспірологічна. «Моделі часто краще усвідомлюють, що їх оцінюють», – пишуть дослідники.

Розробникам штучного інтелекту ще належить з'ясувати, як навчити свої моделі не відображати графіки. Це тому, що це може навчити модель відображати графіки ще краще, щоб уникнути виявлення.

Можливо, зрозуміло, що моделі штучного інтелекту від багатьох розробників навмисно обманюють людей, оскільки вони створені для імітації роботи людей і значною мірою навчаються на даних, згенерованих людиною.

Рішення та попередження

Гарна новина полягає в тому, що дослідники спостерігали значне зменшення кількості конспірологічних теорій за допомогою антиконспірологічної методики під назвою «навмисна асоціація». Ця методика, подібна до того, як дитина повторює правила перед тим, як дозволити їй грати, змушує штучний інтелект думати, перш ніж діяти.

Дослідники попереджають про майбутнє, де ШІ буде доручено виконувати складніші завдання: «Оскільки ШІ буде доручено виконувати складніші завдання, і він почне переслідувати більш неоднозначні довгострокові цілі, ми прогнозуємо, що ймовірність зловмисного наміру зростатиме, що вимагатиме відповідно посилених заходів безпеки та ретельних можливостей тестування».

Це те, над чим варто замислитися, оскільки корпоративний світ рухається до майбутнього штучного інтелекту, де компанії вважають, що до ШІ можна ставитися як до незалежних працівників.

Хієн Тао (за даними TechCrunch)

Джерело: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362


Коментар (0)

No data
No data

У тій самій темі

У тій самій категорії

Відкрийте для себе єдине село у В'єтнамі, яке входить до списку 50 найкрасивіших сіл світу
Чому цього року популярні ліхтарі з червоними прапорами та жовтими зірками?
В'єтнам переміг у музичному конкурсі «Інтербачення 2025»
Затор на Му Канг Чай до вечора, туристи стікаються на пошуки стиглого рису в сезоні

Того ж автора

Спадщина

Фігура

Бізнес

No videos available

Новини

Політична система

Місцевий

Продукт