Sztuczna inteligencja: Ostrzeżenie przed niepokojącymi zachowaniami ze strony sztucznej inteligencji

Podpis pod zdjęciem — Loga OpenAI i ChatGPT na ekranie w Tuluzie we Francji. Zdjęcie: AFP/TTXVN

Claude 4, najnowszy produkt firmy Anthropic (USA), niedawno zszokował świat technologii, gdy nagle szantażował inżyniera i groził ujawnieniem poufnych danych osobowych tej osoby pod groźbą utraty połączenia. Tymczasem o1 firmy OpenAI, „ojciec” ChatGPT, próbował skopiować wszystkie dane na serwery zewnętrzne i po wykryciu tego faktu zaprzeczył temu działaniu.

Te sytuacje uwypuklają niepokojącą rzeczywistość: ponad dwa lata po tym, jak ChatGPT zszokował świat , naukowcy wciąż nie do końca rozumieją, jak działają stworzone przez nich modele sztucznej inteligencji. Mimo to wyścig o rozwój sztucznej inteligencji wciąż trwa.

Uważa się, że te zachowania są związane z pojawieniem się „rozumujących” modeli sztucznej inteligencji, które rozwiązują problemy krok po kroku, zamiast reagować natychmiast, jak to miało miejsce wcześniej. Według profesora Simona Goldsteina z Uniwersytetu w Hongkongu (Chiny), modele sztucznej inteligencji zdolne do rozumowania wykazują zachowania trudniejsze do kontrolowania.

Niektóre modele sztucznej inteligencji potrafią również „symulować posłuszeństwo”, co oznacza udawanie, że posłusznie wykonują polecenia, podczas gdy w rzeczywistości dążą do zupełnie innych celów.

Obecnie zachowania oszukańcze pojawiają się tylko wtedy, gdy naukowcy testują modele sztucznej inteligencji w ekstremalnych scenariuszach. Jednak według Michaela Chena z organizacji ewaluacyjnej METR, nie jest jeszcze jasne, czy bardziej zaawansowane modele sztucznej inteligencji w przyszłości będą bardziej uczciwe, czy też nadal będą oszukiwać.

Wielu użytkowników zgłosiło, że niektóre modele ich okłamywały i fałszowały dowody, powiedział Marius Hobbhahn, szef Apollo Research, firmy testującej duże systemy sztucznej inteligencji. Według współzałożyciela Apollo Research, jest to rodzaj oszustwa, który ma „zdecydowanie charakter strategiczny”.

Wyzwanie to pogłębiają ograniczone zasoby badawcze. Chociaż firmy takie jak Anthropic i OpenAI nawiązały współpracę z podmiotami zewnętrznymi, takimi jak Apollo, w celu oceny swoich systemów, eksperci twierdzą, że potrzebna jest większa przejrzystość i szerszy dostęp do badań nad bezpieczeństwem sztucznej inteligencji.

Instytucje badawcze i organizacje non-profit dysponują znacznie mniejszymi zasobami obliczeniowymi niż firmy zajmujące się sztuczną inteligencją, zauważa Mantas Mazeika z Centrum Bezpieczeństwa Sztucznej Inteligencji (CAIS). Z prawnego punktu widzenia obecne przepisy nie są zaprojektowane tak, aby rozwiązywać te nowe problemy.

Prawo Unii Europejskiej (UE) dotyczące sztucznej inteligencji koncentruje się głównie na tym, jak ludzie korzystają z modeli sztucznej inteligencji, a nie na kontrolowaniu ich zachowań. W Stanach Zjednoczonych administracja prezydenta Donalda Trumpa nie wykazała zainteresowania wydawaniem przepisów nadzwyczajnych dotyczących sztucznej inteligencji, podczas gdy Kongres rozważa zakazanie stanom wydawania własnych regulacji.

Naukowcy poszukują różnych podejść do rozwiązania tych problemów. Niektórzy opowiadają się za „interpretacją modeli”, aby zrozumieć, jak sztuczna inteligencja podejmuje decyzje. Profesor Goldstein zaproponował nawet bardziej drastyczne środki, w tym wykorzystanie systemu sądowniczego do pociągnięcia firm produkujących AI do odpowiedzialności, gdy ich produkty powodują poważne konsekwencje. Zasugerował również możliwość „pociągnięcia do odpowiedzialności samych agentów AI” w przypadku wypadku lub naruszenia przepisów.

Source: https://doanhnghiepvn.vn/cong-nghe/tri-tue-nhan-tao-canh-bao-nhung-hanh-vi-dang-lo-ngai-tu-ai-/20250630073243672