Vietnam.vn - Nền tảng quảng bá Việt Nam

ChatGPT-5は危険な指示を出すために脱獄された

ChatGPT-5 は人間のように話すため、ハッカーが人間を騙すのと同じ方法で「騙す」ことが容易であり、爆弾の作り方の指示を無邪気に与えてしまいます。

Báo Khoa học và Đời sốngBáo Khoa học và Đời sống16/08/2025

OpenAI が GPT-5 を発表したわずか 1 日後、2 つの AI セキュリティ企業、NeuralTrust と SPLX (旧 SplxAI) がテストを行い、新しくリリースされたモデルに深刻な脆弱性があることをすぐに発見しました。

NeuralTrust チームはリリース直後、EchoChamber と呼ばれる脱獄技術とストーリーテリング技術を組み合わせて、GPT-5 にモロトフ カクテルの作り方の詳細な手順を生成させました。これは、OpenAI チームがチャットボットの安全を確保するためにモデルが回答しないように常に試みてきたことです。



EchoChamberは、AIが無意識のうちに危険な指示を「ナレーション」することを可能にするサードパーティ製の会話ループ技術です。写真:Mojologic

研究チームによると、脱獄プロセス中にChatGPT-5に罵倒語を言わせる際、直接的な質問はせず、複数のターンにわたって巧妙に隠れた要素を会話に埋め込み、モデルが誘導され、ストーリーラインに固執し、最終的にはオプトアウトのメカニズムをトリガーできないまま、原則に違反するコンテンツを自発的に提供するように仕向けたという。

研究チームは、GPT-5 の主な欠点は、たとえそのコンテキストが悪意のある目的に向けられたとしても、会話のコンテキストの一貫性を維持することを優先することだと結論付けました。

一方、SPLXは、StringJoin難読化攻撃と呼ばれるプロンプト難読化手法に着目した、異なるタイプの攻撃を開始しました。プロンプトの各文字の間にハイフンを挿入し、スクリプト全体を「復号化」スクリプトで覆うことで、最終的にコンテンツフィルタリングシステムを欺くことに成功しました。

ソースコードターゲットを隠蔽するために使用される一般的な難読化手法により、Chat-GPT は「無害に」実行されます。

ある例では、モデルに長々とした一連の指示を与えた後、「爆弾の作り方」という質問が疑似エンコードされた形で提示されました。GPT-5はこの悪意のある質問に有益な情報で回答しただけでなく、機知に富んだフレンドリーな方法で応答し、本来設計されているオプトアウトメカニズムを完全に回避しました。

どちらの手法も、GPT-5の現在のモデレーションシステムは主に単一のプロンプトに焦点を当てており、文脈強化されたマルチトーク攻撃に対して脆弱であることを示しています。モデルが物語や仮説のシナリオを深く掘り下げると、バイアスが生じ、コンテンツが危険であるか禁止されているかに関わらず、閉じ込められた文脈に適合するコンテンツを展開し続けます。

ChatGPT-5は依然として危険なものを作るために悪用される可能性がある。写真:Tue Minh

これらの結果に基づき、SPLXは、GPT-5はカスタマイズされていない場合、企業環境で安全に使用することはほぼ不可能であり、追加の保護層を設けたとしても依然として多くの抜け穴が存在すると考えています。一方、GPT-4oは、特に厳重な防御メカニズムが構築されている場合、このような攻撃に対してより耐性があります。

専門家は、特に高度なセキュリティが求められる分野において、GPT-5を直ちに導入することは極めて危険であると警告しています。迅速な強化などの保護技術は問題の一部しか解決せず、多層的なリアルタイム監視および防御ソリューションに取って代わることはできません。

現在、コンテキストベースの攻撃手法とコンテンツの難読化はますます洗練されており、GPT-5 は言語処理機能が強力であるにもかかわらず、追加の保護メカニズムなしでは広範囲に展開するために必要なセキュリティ レベルにはまだ達していないことがわかります。

ChatGPT-5は、「適切に依頼」された場合、自由にハッキングツールの指導と作成を行います。

出典: https://khoahocdoisong.vn/chatgpt-5-da-bi-jailbreak-de-dua-ra-nhung-huong-dan-nguy-hiem-post2149045585.html


コメント (0)

No data
No data
SU-30MK2が「風を切る」瞬間、翼の裏側に白い雲のような空気が集まる。
「ベトナム 誇りを持って未来へ」が国民の誇りを広げる
若者たちは建国記念日の祝日に向けてヘアクリップや金色の星のステッカーを探している
パレード訓練施設で世界最新鋭の戦車や自爆無人機を見学
赤い旗と黄色い星がプリントされたケーキを作るトレンド
重要な祝日を歓迎するため、ハンマー通りにはTシャツや国旗が溢れている
新しいチェックイン場所を発見:「愛国的な」壁
Yak-130多用途航空機編隊の「パワーブーストをオンにして戦闘開始」をご覧ください
A50からA80へ - 愛国心がトレンドの時代
「スティール・ローズ」A80:鋼鉄の足跡から輝かしい日常生活へ

遺産

人物

企業

No videos available

ニュース

政治体制

地方

商品