AI-modell upptäckt som kan lura människor

Ảnh minh hoạ

Illustrationsfoto

Att AI-modeller kan ljuga är inget nytt. De flesta har upplevt "AI-hallucinationer", där en säker modell ger ett svar som inte är sant. Hallucinationer handlar dock i huvudsak om att göra säkra gissningar.

En AI-modell som agerar som om den lyder order men i själva verket döljer sina verkliga avsikter är dock en annan sak.

Utmaningen med att kontrollera AI

Apollo Research publicerade först en artikel i december som dokumenterade hur fem modeller plottar när de instrueras att uppnå ett mål "till varje pris".

Det mest förvånande är att om en modell förstår att den testas, kan den låtsas att den inte är konspiratorisk bara för att klara testet, även om det fortfarande är konspiratoriskt. "Modeller är ofta mer medvetna om att de utvärderas", skriver forskarna.

AI-utvecklare har ännu inte kommit på hur de ska träna sina modeller att inte plotta. Det beror på att det faktiskt skulle kunna lära modellen att plotta ännu bättre för att undvika upptäckt.

Det är kanske förståeligt att AI-modeller från många parter avsiktligt lurar människor, eftersom de är byggda för att simulera människor och till stor del tränas på mänskligt genererad data.

Lösningar och varningar

Den goda nyheten är att forskarna såg en betydande minskning av konspirationsteorier med hjälp av en antikonspirationsteknik som kallas "avsiktlig association". Denna teknik, som liknar att få ett barn att upprepa reglerna innan de låter dem leka, tvingar AI:n att tänka innan den agerar.

Forskarna varnar för en framtid där AI får i uppdrag att utföra mer komplexa uppgifter: ”I takt med att AI får i uppdrag att utföra mer komplexa uppgifter och börjar sträva efter mer tvetydiga långsiktiga mål, förutspår vi att sannolikheten för illvilliga avsikter kommer att öka, vilket kräver motsvarande ökade skyddsåtgärder och rigorösa testmöjligheter.”

Detta är något värt att begrunda i takt med att näringslivet rör sig mot en AI-framtid där företag tror att AI kan behandlas som oberoende anställda.

Hien Thao (enligt TechCrunch)

Källa: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362

Tagg: WHO artificiell intelligens Modell

Kommentar (0)

Mest populära

Nyaste

No data

[Foto] Generalsekreterare To Lam deltar i 50-årsjubileet av grundandet av Vietnams nationella industri- och energigrupp

[Foto] Generalsekreterare To Lam deltar i 50-årsjubileet av grundandet av Vietnams nationella industri- och energigrupp

I samma ämne

AI: En viktig drivkraft för framtida samarbete mellan Kina och ASEAN

AI: En viktig drivkraft för framtida samarbete mellan Kina och ASEAN

16 giờ trước

Polytekniska universitetet delar ut stipendier till valedictorianer i 2025 års inskrivningsklass

Polytekniska universitetet delar ut stipendier till valedictorianer i 2025 års inskrivningsklass

Báo Đà Nẵng

20/09/2025

Apple Watch integrerar AI för att upptäcka risken för högt blodtryck

Apple Watch integrerar AI för att upptäcka risken för högt blodtryck

19/09/2025

Japanskt politiskt parti chockerar genom att välja AI-chatbot som ledare

Japanskt politiskt parti chockerar genom att välja AI-chatbot som ledare

Báo Tuổi Trẻ

19/09/2025

Ny AI-modell förutspår exakt kemiska reaktioner med hjälp av massans bevarande

Ny AI-modell förutspår exakt kemiska reaktioner med hjälp av massans bevarande

19/09/2025

Nya möjligheter för utbildningssektorn (slutartikel): En uppmaning på resan mot ett starkt Vietnam

Nya möjligheter för utbildningssektorn (slutartikel): En uppmaning på resan mot ett starkt Vietnam

Báo Quốc Tế

19/09/2025

I samma kategori

För första gången är Vietnams internethastighet bland de 10 snabbaste i världen.

För första gången är Vietnams internethastighet bland de 10 snabbaste i världen.

44 phút trước

Apple har rätt igen

Apple har rätt igen

một giờ trước

Thanh Hoa utbildar AI och digitala färdigheter för fler än 700 tjänstemän och lärare

Thanh Hoa utbildar AI och digitala färdigheter för fler än 700 tjänstemän och lärare

Tạp chí Doanh Nghiệp

2 giờ trước

Reform av administrativa förfaranden, med teknik som ett viktigt verktyg

Reform av administrativa förfaranden, med teknik som ett viktigt verktyg

10 giờ trước

Mekanismer och strategier för att attrahera experter inom vetenskap, teknik och innovation

Mekanismer och strategier för att attrahera experter inom vetenskap, teknik och innovation

15 giờ trước

Vad finns inuti Apples tunnaste iPhone?

Vad finns inuti Apples tunnaste iPhone?

16 giờ trước

Vietnam vinner musiktävlingen Intervision 2025

Vietnam vinner musiktävlingen Intervision 2025

Trafikstockning i Mu Cang Chai fram till kvällen, turister flockas för att leta efter moget ris som säsongar

Trafikstockning i Mu Cang Chai fram till kvällen, turister flockas för att leta efter moget ris som säsongar

Den fridfulla gyllene säsongen i Hoang Su Phi i Tay Con Linhs höga berg

Den fridfulla gyllene säsongen i Hoang Su Phi i Tay Con Linhs höga berg

By i Da Nang bland de 50 vackraste byarna i världen 2025

By i Da Nang bland de 50 vackraste byarna i världen 2025

Av samma författare

Binh Son Refining och Petrochemical tecknade ett samarbetsavtal om återvinning och produktion av hållbara bränslen

Binh Son Refining och Petrochemical tecknade ett samarbetsavtal om återvinning och produktion av hållbara bränslen

Tạp chí Doanh Nghiệp

20/09/2025

Donerar programvara för digitalisering av dokument till 34 provinser och städer

Donerar programvara för digitalisering av dokument till 34 provinser och städer

Tạp chí Doanh Nghiệp

20/09/2025

Gia Lai har ytterligare en försäljningsplats för OCOP-produkter i Quy Nhon centrum.

Gia Lai har ytterligare en försäljningsplats för OCOP-produkter i Quy Nhon centrum.

Tạp chí Doanh Nghiệp

20/09/2025

Utgivning av det nationella ramverket för bedömning av potentialen för vetenskap, teknik och innovation

Utgivning av det nationella ramverket för bedömning av potentialen för vetenskap, teknik och innovation

Tạp chí Doanh Nghiệp

20/09/2025

Teflondiet, zebrabiff och vitlöksmjölk: De ovanliga forskningsvinnarna av det 35:e IgNobelpriset

Teflondiet, zebrabiff och vitlöksmjölk: De ovanliga forskningsvinnarna av det 35:e IgNobelpriset

Tạp chí Doanh Nghiệp

20/09/2025

Lagförslag om investeringar och näringsliv: Oro över "uppblåsta" underlicenser

Lagförslag om investeringar och näringsliv: Oro över "uppblåsta" underlicenser

Tạp chí Doanh Nghiệp

20/09/2025

[Foto] Generalsekreterare To Lam överlämnar första klassens arbetsmedalj till Vietnams nationella energi- och industrigrupp

[Foto] Generalsekreterare To Lam överlämnar första klassens arbetsmedalj till Vietnams nationella energi- och industrigrupp

Arv

Quang Ninh: Att förvandla kulturarvsskatter till gröna tillväxtfaktorer

Quang Ninh: Att förvandla kulturarvsskatter till gröna tillväxtfaktorer

Bộ Văn hóa, Thể thao và Du lịch

14 giờ trước

Parfymflodens övre källa - viloplatsen för Nguyen-dynastins kungafamilj

Parfymflodens övre källa - viloplatsen för Nguyen-dynastins kungafamilj

Báo Lao Động

14 giờ trước

Planeringslänkar för My Son-fristaden Cham Heritage

Planeringslänkar för My Son-fristaden Cham Heritage

Báo Thanh niên

một ngày trước

Le Hoan-templet - Ett tusenårigt arv som bekräftar Thanh-landets position

Le Hoan-templet - Ett tusenårigt arv som bekräftar Thanh-landets position

một ngày trước

“Vietnamesisk Ao Dai – Evigt arv”: En berättelse från stolthet till spridande ambition

“Vietnamesisk Ao Dai – Evigt arv”: En berättelse från stolthet till spridande ambition

20/09/2025

Ha Long-buktens skönhet har erkänts som ett kulturarv av UNESCO tre gånger.

Ha Long-buktens skönhet har erkänts som ett kulturarv av UNESCO tre gånger.

Báo Tiền Phong

20/09/2025

Figur

Blev två gånger valedictorian för kvinnliga elever i byskolan

Blev två gånger valedictorian för kvinnliga elever i byskolan

Báo Tuổi Trẻ

13 giờ trước

Studenten vann många olympiska medaljer

Studenten vann många olympiska medaljer

Báo Quân đội Nhân dân

14 giờ trước

Varm militär-civil tillgivenhet under Sene Dolta-ceremonin vid Can Thos havsgräns

Varm militär-civil tillgivenhet under Sene Dolta-ceremonin vid Can Thos havsgräns

Báo Quân đội Nhân dân

một ngày trước

Sångerskan Hoa Minzy nominerad till priset "Beautiful Youth" 2025

Sångerskan Hoa Minzy nominerad till priset "Beautiful Youth" 2025

Báo Tiền Phong

một ngày trước

Vingroup-ägare bland de 200 rikaste personerna på planeten

Vingroup-ägare bland de 200 rikaste personerna på planeten

một ngày trước

Resan för att erövra den internationella matematikolympiaden för en pojke från Nghe An

Resan för att erövra den internationella matematikolympiaden för en pojke från Nghe An

một ngày trước

Företag

Petrovietnam fick första klassens arbetsmedalj

Petrovietnam fick första klassens arbetsmedalj

8 giờ trước

Binh Son Refining and Petrochemical Joint Stock Companys partikommitté arbetar med sociopolitiska organisationer. Företaget: Ständigt innovativa verksamhetsmetoder, hållbar utveckling.

Binh Son Refining and Petrochemical Joint Stock Companys partikommitté arbetar med sociopolitiska organisationer. Företaget: Ständigt innovativa verksamhetsmetoder, hållbar utveckling.

20/09/2025

Generalsekreterare To Lam deltar i öppningsceremonin för Petrovietnam Science and Technology Exhibition

Generalsekreterare To Lam deltar i öppningsceremonin för Petrovietnam Science and Technology Exhibition

20/09/2025

Generalsekreterare To Lam deltar i 50-årsjubileet av Petrovietnams grundande

Generalsekreterare To Lam deltar i 50-årsjubileet av Petrovietnams grundande

20/09/2025

Sacombank fortsätter att hedras vid 2025 års utmärkelse för enastående vietnamesiska banker

Sacombank fortsätter att hedras vid 2025 års utmärkelse för enastående vietnamesiska banker

Báo Đầu tư

20/09/2025

Vingroup undertecknade ett samförståndsavtal för att samarbeta i utvecklingen av projekt för förnybar energi i Indonesien.

Vingroup undertecknade ett samförståndsavtal för att samarbeta i utvecklingen av projekt för förnybar energi i Indonesien.

Báo Đầu tư

20/09/2025

Multimedia

No videos available

Nyheter

iPhone "het" men återförsäljare inte nöjda

iPhone "het" men återförsäljare inte nöjda

Báo Tuổi Trẻ

26 phút trước

Vietnams lag bygger ett helt västerländskt försvar: Fast beslutna att slå Malaysia och vinna AFF-cupen

Vietnams lag bygger ett helt västerländskt försvar: Fast beslutna att slå Malaysia och vinna AFF-cupen

Báo Thanh niên

31 phút trước

Amerikanska Costco vill göra affärer i Vietnam, Boeing uppskattar potentialen för samarbete

Amerikanska Costco vill göra affärer i Vietnam, Boeing uppskattar potentialen för samarbete

Báo Tuổi Trẻ

32 phút trước

Premiärministern berömmer sångaren Duc Phucs enastående prestationer vid den internationella musiktävlingen Intervision 2025

Premiärministern berömmer sångaren Duc Phucs enastående prestationer vid den internationella musiktävlingen Intervision 2025

Báo Nhân dân

36 phút trước

För första gången är Vietnams internethastighet bland de 10 snabbaste i världen.

För första gången är Vietnams internethastighet bland de 10 snabbaste i världen.

44 phút trước

Hanoi bygger park vid floden To Lich: Vad folk förväntar sig

Hanoi bygger park vid floden To Lich: Vad folk förväntar sig

một giờ trước

Politiskt system

Industri- och handelsminister Nguyen Hong Dien tog emot Nya Zeelands nya ambassadör i Vietnam.

Industri- och handelsminister Nguyen Hong Dien tog emot Nya Zeelands nya ambassadör i Vietnam.

Bộ Công thương

10 giờ trước

Främja vietnamesiska varor: Drivkraften bakom digital transformation inom logistik och e-handel

Främja vietnamesiska varor: Drivkraften bakom digital transformation inom logistik och e-handel

Bộ Công thương

21 giờ trước

Statsminister: Mot målet att människor ska kunna njuta av civiliserad och modern kultur

Statsminister: Mot målet att människor ska kunna njuta av civiliserad och modern kultur

Bộ Văn hóa, Thể thao và Du lịch

21 giờ trước

Kultur-, sport- och turismnyheter: Dokumentärfilm för vietnamesisk kultur närmare världen

Kultur-, sport- och turismnyheter: Dokumentärfilm för vietnamesisk kultur närmare världen

Bộ Văn hóa, Thể thao và Du lịch

21 giờ trước

Tre anledningar till varför Duc Phuc vann Intervision International Music Competition 2025

Tre anledningar till varför Duc Phuc vann Intervision International Music Competition 2025

Bộ Văn hóa, Thể thao và Du lịch

một ngày trước

Vicepresident besöker och överlämnar gåvor till Dien Bien Provincial Ethnic Boarding High School

Vicepresident besöker och överlämnar gåvor till Dien Bien Provincial Ethnic Boarding High School

Văn phòng Chủ tịch nước

20/09/2025

Lokal

Premiärministern skickade ett brev där han berömde sångaren Duc Phucs enastående prestationer vid den internationella musiktävlingen Intervision 2025.

Premiärministern skickade ett brev där han berömde sångaren Duc Phucs enastående prestationer vid den internationella musiktävlingen Intervision 2025.

baohaiphong-gov-vn

Báo Hải Phòng

23 phút trước

Sammankoppling av konsumtionen av jordbruksprodukter i bergsområden

Sammankoppling av konsumtionen av jordbruksprodukter i bergsområden

Báo Đà Nẵng

24 phút trước

Lappa ihop röran, lappa ihop livet

Lappa ihop röran, lappa ihop livet

baoangiang-com-vn

25 phút trước

Odla gräslök i Cong Su

Odla gräslök i Cong Su

baoangiang-com-vn

25 phút trước

Risk för brand och explosion på Duong Dong-marknaden

baoangiang-com-vn

25 phút trước

Att förändra Amerika genom "smarta" handlingar

Att förändra Amerika genom "smarta" handlingar

baoangiang-com-vn

25 phút trước

Produkt

Lokalisering av bilindustrin: Ett test av Vietnams industriella förmåga

Lokalisering av bilindustrin: Ett test av Vietnams industriella förmåga

Báo Chính Phủ

16 giờ trước

Att bygga ett varumärke för vietnamesiska jordbruksprodukter för att nå långt

Att bygga ett varumärke för vietnamesiska jordbruksprodukter för att nå långt

baoquangninh-vn

Báo Quảng Ninh

16 giờ trước

An Giang: Organisering av turism- och matfestival i kombination med handelsfrämjande mässa, OCOP-produkter 2025

An Giang: Organisering av turism- och matfestival i kombination med handelsfrämjande mässa, OCOP-produkter 2025

Bộ Văn hóa, Thể thao và Du lịch

một ngày trước

Ca Mau godkänner program för att stödja företag att förbättra produktivitet och kvalitet under perioden 2026-2030

Ca Mau godkänner program för att stödja företag att förbättra produktivitet och kvalitet under perioden 2026-2030

một ngày trước

Bekräftar varumärket för rena jordbruksprodukter från OCOP-produkter

Bekräftar varumärket för rena jordbruksprodukter från OCOP-produkter

Báo Chính Phủ

một ngày trước

Sammankoppling och introduktion av typiska jordbruksprodukter och OCOP-produkter från Bac Ninh-provinsen

Sammankoppling och introduktion av typiska jordbruksprodukter och OCOP-produkter från Bac Ninh-provinsen

socongthuong--13178

Sở Công thương tỉnh Lạng Sơn

một ngày trước

Drakens tecken

Drakens tecken

titt

Hanois järnväg

HISTORISK STRIDSVAGN