AI-modell oppdaget som kan lure mennesker

Ảnh minh hoạ

Illustrasjonsfoto

At AI-modeller kan lyve er ikke noe nytt. De fleste har opplevd «AI-hallusinasjoner», der en sikker modell gir et svar som ikke er sant. Hallusinasjoner handler imidlertid i hovedsak om å komme med sikre gjetninger.

En AI-modell som oppfører seg som om den adlyder ordre, men som faktisk skjuler sine sanne intensjoner, er imidlertid en annen sak.

Utfordringen med å kontrollere AI

Apollo Research publiserte først en artikkel i desember som dokumenterte hvordan fem modeller plotter når de blir bedt om å oppnå et mål «for enhver pris».

Det mest overraskende er at hvis en modell forstår at den blir testet, kan den late som om den ikke er konspiratorisk bare for å bestå testen, selv om den fortsatt er konspiratorisk. «Modeller er ofte mer bevisste på at de blir evaluert», skriver forskerne.

AI-utviklere har ennå ikke funnet ut hvordan de skal trene modellene sine til ikke å plotte. Det er fordi det faktisk kan lære modellen å plotte enda bedre for å unngå deteksjon.

Det er kanskje forståelig at AI-modeller fra mange parter bevisst ville lure mennesker, ettersom de er bygget for å simulere mennesker og i stor grad er trent på menneskeskapte data.

Løsninger og advarsler

Den gode nyheten er at forskerne så en betydelig reduksjon i konspirasjoner ved å bruke en antikonspirasjonsteknikk kalt «bevisst assosiasjon». Denne teknikken, som kan sammenlignes med å få et barn til å gjenta reglene før de lar dem leke, tvinger AI-en til å tenke før den handler.

Forskerne advarer om en fremtid der AI får mer komplekse oppgaver: «Etter hvert som AI får mer komplekse oppgaver og begynner å forfølge mer tvetydige langsiktige mål, spår vi at sannsynligheten for ondsinnet hensikt vil øke, noe som krever tilsvarende økte sikkerhetstiltak og strenge testmuligheter.»

Dette er noe verdt å tenke over ettersom næringslivet beveger seg mot en AI-fremtid der selskaper tror at AI kan behandles som uavhengige ansatte.

Hien Thao (ifølge TechCrunch)

Kilde: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362

Tagg: WHO kunstig intelligens Modell

Kommentar (0)

Mest populær

Nyeste

No data

[Foto] Generalsekretær To Lam deltar på 50-årsjubileet for grunnleggelsen av Vietnams nasjonale industri- og energigruppe

[Foto] Generalsekretær To Lam deltar på 50-årsjubileet for grunnleggelsen av Vietnams nasjonale industri- og energigruppe

I samme emne

AI: En viktig drivkraft for fremtidig samarbeid mellom Kina og ASEAN

AI: En viktig drivkraft for fremtidig samarbeid mellom Kina og ASEAN

3 giờ trước

Polyteknisk universitet tildeler stipend til avgangselever fra 2025-kullet

Polyteknisk universitet tildeler stipend til avgangselever fra 2025-kullet

Báo Đà Nẵng

một ngày trước

Apple Watch integrerer AI for å oppdage risikoen for høyt blodtrykk

Apple Watch integrerer AI for å oppdage risikoen for høyt blodtrykk

19/09/2025

Japansk politisk parti sjokkerer ved å velge AI-chatbot som leder

Japansk politisk parti sjokkerer ved å velge AI-chatbot som leder

Báo Tuổi Trẻ

19/09/2025

Ny AI-modell forutsier nøyaktig kjemiske reaksjoner ved hjelp av massebevaring

Ny AI-modell forutsier nøyaktig kjemiske reaksjoner ved hjelp av massebevaring

19/09/2025

Nye muligheter for utdanningssektoren (avsluttende artikkel): En oppfordring på reisen mot et sterkt Vietnam

Nye muligheter for utdanningssektoren (avsluttende artikkel): En oppfordring på reisen mot et sterkt Vietnam

Báo Quốc Tế

19/09/2025

I samme kategori

Utviklingen av sportshodetelefoner

Utviklingen av sportshodetelefoner

một giờ trước

Mekanismer og retningslinjer for å tiltrekke seg eksperter innen vitenskap, teknologi og innovasjon

Mekanismer og retningslinjer for å tiltrekke seg eksperter innen vitenskap, teknologi og innovasjon

2 giờ trước

Hva er inni Apples tynneste iPhone?

Hva er inni Apples tynneste iPhone?

3 giờ trước

«Galaksens stemmer»: Når vanlige, men likevel ekstraordinære vietnamesere snakker ut

«Galaksens stemmer»: Når vanlige, men likevel ekstraordinære vietnamesere snakker ut

5 giờ trước

Det hvite hus informerer om de nye «eierne» av TikTok-applikasjonen i USA

Det hvite hus informerer om de nye «eierne» av TikTok-applikasjonen i USA

8 giờ trước

Er iPhone 17 lett å ripe?

Er iPhone 17 lett å ripe?

9 giờ trước

Vietnam vinner musikkkonkurransen Intervision 2025

Vietnam vinner musikkkonkurransen Intervision 2025

Trafikkork i Mu Cang Chai frem til kvelden, turister strømmer til for å lete etter moden ris i sesongen

Trafikkork i Mu Cang Chai frem til kvelden, turister strømmer til for å lete etter moden ris i sesongen

Den fredelige gylne sesongen i Hoang Su Phi i de høye fjellene i Tay Con Linh

Den fredelige gylne sesongen i Hoang Su Phi i de høye fjellene i Tay Con Linh

Landsby i Da Nang blant de 50 vakreste landsbyene i verden i 2025

Landsby i Da Nang blant de 50 vakreste landsbyene i verden i 2025

Av samme forfatter

Binh Son Refining og Petrochemical signerte en samarbeidsavtale om resirkulering og produksjon av bærekraftig drivstoff

Binh Son Refining og Petrochemical signerte en samarbeidsavtale om resirkulering og produksjon av bærekraftig drivstoff

Tạp chí Doanh Nghiệp

một ngày trước

Donerer programvare for digitalisering av dokumenter til 34 provinser og byer

Donerer programvare for digitalisering av dokumenter til 34 provinser og byer

Tạp chí Doanh Nghiệp

20/09/2025

Gia Lai har et annet salgssted for OCOP-produkter i Quy Nhon-senteret.

Gia Lai har et annet salgssted for OCOP-produkter i Quy Nhon-senteret.

Tạp chí Doanh Nghiệp

20/09/2025

Utstedelse av det nasjonale rammeverket for vurdering av potensialet for vitenskap, teknologi og innovasjon

Utstedelse av det nasjonale rammeverket for vurdering av potensialet for vitenskap, teknologi og innovasjon

Tạp chí Doanh Nghiệp

20/09/2025

Teflon-dietten, sebrabiff og hvitløksmelk: De uvanlige forskningsvinnerne av den 35. IgNobelprisen

Teflon-dietten, sebrabiff og hvitløksmelk: De uvanlige forskningsvinnerne av den 35. IgNobelprisen

Tạp chí Doanh Nghiệp

20/09/2025

Lovforslag om investering og næringsliv: Bekymringer om «oppblåsning» av underlisenser

Lovforslag om investering og næringsliv: Bekymringer om «oppblåsning» av underlisenser

Tạp chí Doanh Nghiệp

20/09/2025

Stranden ligger en 3,5 timers kjøretur fra Hanoi og roses av gjestene som et ideelt campingsted.

Stranden ligger en 3,5 timers kjøretur fra Hanoi og roses av gjestene som et ideelt campingsted.

Arv

Quang Ninh: Å gjøre kulturminner om til grønne vekstfaktorer

Quang Ninh: Å gjøre kulturminner om til grønne vekstfaktorer

Bộ Văn hóa, Thể thao và Du lịch

34 phút trước

Den øvre kilden til Parfymeelven – hvilestedet til kongefamilien fra Nguyen-dynastiet

Den øvre kilden til Parfymeelven – hvilestedet til kongefamilien fra Nguyen-dynastiet

Báo Lao Động

42 phút trước

Planleggingslenker for My Son-helligdommen Cham Heritage

Planleggingslenker for My Son-helligdommen Cham Heritage

Báo Thanh niên

10 giờ trước

Le Hoan-tempelet – en tusenårig arv som bekrefter Thanh-landets posisjon

Le Hoan-tempelet – en tusenårig arv som bekrefter Thanh-landets posisjon

11 giờ trước

«Vietnamesisk Ao Dai – Evig arv»: En historie fra stolthet til spredende ambisjoner

«Vietnamesisk Ao Dai – Evig arv»: En historie fra stolthet til spredende ambisjoner

một ngày trước

Ha Long-buktens skjønnhet har blitt anerkjent av UNESCO som et kulturarvsted tre ganger.

Ha Long-buktens skjønnhet har blitt anerkjent av UNESCO som et kulturarvsted tre ganger.

Báo Tiền Phong

một ngày trước

Figur

To ganger ble han valedictorian for kvinnelige elever på landsbyskolen

To ganger ble han valedictorian for kvinnelige elever på landsbyskolen

Báo Tuổi Trẻ

29 phút trước

Studenten vant mange olympiske medaljer

Studenten vant mange olympiske medaljer

Báo Quân đội Nhân dân

một giờ trước

Varm militær-sivil hengivenhet under Sene Dolta-seremonien ved Can Thos grense

Varm militær-sivil hengivenhet under Sene Dolta-seremonien ved Can Thos grense

Báo Quân đội Nhân dân

9 giờ trước

Sangerinnen Hoa Minzy nominert til prisen «Beautiful Youth» 2025

Sangerinnen Hoa Minzy nominert til prisen «Beautiful Youth» 2025

Báo Tiền Phong

10 giờ trước

Vingroup-eier blant de 200 rikeste menneskene på planeten

Vingroup-eier blant de 200 rikeste menneskene på planeten

10 giờ trước

Reisen for å erobre den internasjonale matematiske olympiaden til en gutt fra Nghe An

Reisen for å erobre den internasjonale matematiske olympiaden til en gutt fra Nghe An

11 giờ trước

Forretninger

Den stående komiteen i partikomiteen til Binh Son Refining and Petrochemical Joint Stock Company samarbeider med sosiopolitiske organisasjoner. Selskapet: Stadig innovative driftsmetoder, bærekraftig utvikling.

Den stående komiteen i partikomiteen til Binh Son Refining and Petrochemical Joint Stock Company samarbeider med sosiopolitiske organisasjoner. Selskapet: Stadig innovative driftsmetoder, bærekraftig utvikling.

19 giờ trước

Generalsekretær To Lam deltar på 50-årsjubileet for Petrovietnams grunnleggelse

Generalsekretær To Lam deltar på 50-årsjubileet for Petrovietnams grunnleggelse

19 giờ trước

Sacombank fortsetter å bli hedret ved prisen for fremragende vietnamesisk bank i 2025

Sacombank fortsetter å bli hedret ved prisen for fremragende vietnamesisk bank i 2025

Báo Đầu tư

20/09/2025

Vingroup signerte en intensjonsavtale om samarbeid om utvikling av fornybare energiprosjekter i Indonesia.

Vingroup signerte en intensjonsavtale om samarbeid om utvikling av fornybare energiprosjekter i Indonesia.

Báo Đầu tư

20/09/2025

Vinamilk og lærdommen om å gjøre grønne kostnader om til merkevarekraft

Vinamilk og lærdommen om å gjøre grønne kostnader om til merkevarekraft

Báo Chính Phủ

20/09/2025

[VIDEO] 50 år med Petrovietnam: Holder arven levende, skaper nasjonal energi

[VIDEO] 50 år med Petrovietnam: Holder arven levende, skaper nasjonal energi

19/09/2025

Multimedia

No videos available

Nyheter

Berømt russisk konferansier: «Duc Phuc er deltakeren med den mest forseggjorte iscenesettelsen»

Berømt russisk konferansier: «Duc Phuc er deltakeren med den mest forseggjorte iscenesettelsen»

8 giờ trước

Hvilke fordeler vil Hanoi og Ho Chi Minh-byen få hvis de blir spesielle byområder?

Hvilke fordeler vil Hanoi og Ho Chi Minh-byen få hvis de blir spesielle byområder?

Báo Tuổi Trẻ

9 giờ trước

Titusenvis av mennesker strømmer til for å se gigantiske midthøstlykter lyse opp i Tuyen Quang

Titusenvis av mennesker strømmer til for å se gigantiske midthøstlykter lyse opp i Tuyen Quang

9 giờ trước

Å skape et økosystem for at vietnamesisk kino skal kunne slå gjennom

Å skape et økosystem for at vietnamesisk kino skal kunne slå gjennom

Báo Nhân dân

9 giờ trước

Styrking av Vietnams posisjon på den internasjonale arenaen

Styrking av Vietnams posisjon på den internasjonale arenaen

Báo Nhân dân

9 giờ trước

Sangeren Duc Phuc skrev historie da han vant Intervision 2025 og mottok mer enn 9 milliarder VND.

Sangeren Duc Phuc skrev historie da han vant Intervision 2025 og mottok mer enn 9 milliarder VND.

9 giờ trước

Det politiske systemet

Fremme vietnamesiske varer: Drivkraften bak digital transformasjon innen logistikk og e-handel

Fremme vietnamesiske varer: Drivkraften bak digital transformasjon innen logistikk og e-handel

Bộ Công thương

8 giờ trước

Statsminister: Mot målet om at folk skal kunne nyte sivilisert og moderne kultur

Statsminister: Mot målet om at folk skal kunne nyte sivilisert og moderne kultur

Bộ Văn hóa, Thể thao và Du lịch

8 giờ trước

Kultur-, sport- og turismenyheter: Dokumentarfilm bringer vietnamesisk kultur nærmere verden

Kultur-, sport- og turismenyheter: Dokumentarfilm bringer vietnamesisk kultur nærmere verden

Bộ Văn hóa, Thể thao và Du lịch

8 giờ trước

Tre grunner til at Duc Phuc vant Intervision International Music Competition i 2025

Tre grunner til at Duc Phuc vant Intervision International Music Competition i 2025

Bộ Văn hóa, Thể thao và Du lịch

10 giờ trước

Visepresident besøker og overrekker gaver til Dien Bien Provincial Ethnic Boarding High School

Visepresident besøker og overrekker gaver til Dien Bien Provincial Ethnic Boarding High School

Văn phòng Chủ tịch nước

20/09/2025

RCEP og merkevaregapet til vietnamesiske bedrifter

RCEP og merkevaregapet til vietnamesiske bedrifter

Bộ Công thương

20/09/2025

Lokalt

Få fart på fremdriften av Da Huoai Industrial Cluster-prosjektet, Lam Dong

Få fart på fremdriften av Da Huoai Industrial Cluster-prosjektet, Lam Dong

Báo Lâm Đồng

27 phút trước

Solskinnsdag, stormfull natt

Solskinnsdag, stormfull natt

một giờ trước

Lansering av en modell for å forebygge vold i hjemmet i Thanh Sen-distriktet

Lansering av en modell for å forebygge vold i hjemmet i Thanh Sen-distriktet

một giờ trước

Risiko for fortsatte jordskred på Tien-elvebreddene i Cao Lanh-distriktet

Risiko for fortsatte jordskred på Tien-elvebreddene i Cao Lanh-distriktet

Báo Sài Gòn Giải phóng

một giờ trước

Can Tho: Tildeler Luong Dinh Cua-stipend verdt nesten 2 milliarder VND

Can Tho: Tildeler Luong Dinh Cua-stipend verdt nesten 2 milliarder VND

Báo Sài Gòn Giải phóng

một giờ trước

Bønder overvinner vanskeligheter for å unnslippe fattigdom

Bønder overvinner vanskeligheter for å unnslippe fattigdom

Báo Đà Nẵng

một giờ trước

Produkt

Lokalisering av bilindustrien: En test av Vietnams industrielle dyktighet

Lokalisering av bilindustrien: En test av Vietnams industrielle dyktighet

Báo Chính Phủ

3 giờ trước

Å bygge et merke for vietnamesiske landbruksprodukter for å nå langt

Å bygge et merke for vietnamesiske landbruksprodukter for å nå langt

baoquangninh-vn

Báo Quảng Ninh

3 giờ trước

An Giang: Organisering av turisme- og matfestival kombinert med handelsfremmende messe, OCOP-produkter 2025

An Giang: Organisering av turisme- og matfestival kombinert med handelsfremmende messe, OCOP-produkter 2025

Bộ Văn hóa, Thể thao và Du lịch

9 giờ trước

Ca Mau godkjenner program for å støtte bedrifter med å forbedre produktivitet og kvalitet i perioden 2026–2030

Ca Mau godkjenner program for å støtte bedrifter med å forbedre produktivitet og kvalitet i perioden 2026–2030

10 giờ trước

Bekrefter merkevaren for rene landbruksprodukter fra OCOP-produkter

Bekrefter merkevaren for rene landbruksprodukter fra OCOP-produkter

Báo Chính Phủ

10 giờ trước

Kobler sammen og introduserer typiske landbruksprodukter og OCOP-produkter fra Bac Ninh-provinsen

Kobler sammen og introduserer typiske landbruksprodukter og OCOP-produkter fra Bac Ninh-provinsen

socongthuong--13178

Sở Công thương tỉnh Lạng Sơn

11 giờ trước

kirkearkitektur

kirkearkitektur

Alene blant de stablede steinene

moren min

Vingård