Vietnam.vn - Nền tảng quảng bá Việt Nam

AI가 생성한 이미지의 편향 사례

Công LuậnCông Luận13/07/2023

[광고_1]

AI 이미지 생성기는 어떻게 작동하나요?

AI 기반 이미지 생성기는 사용자가 입력한 텍스트를 입력받아 설명과 일치하는 하나 이상의 이미지를 생성하는 머신러닝 모델을 사용합니다. 이러한 모델을 학습하려면 수백만 개의 이미지가 포함된 방대한 데이터세트가 필요합니다.

그림 속 이상한 오류는 누가 만들었을까요? 이미지 1

AI를 활용한 이미지 생성이 점점 더 쉬워지고 있습니다. 사진: Ijnet

Midjourney와 DALL-E 2 모두 알고리즘 작동 방식을 공개적으로 공개하지는 않지만, 대부분의 AI 이미지 생성기는 확산이라는 프로세스를 사용합니다. 확산 모델은 훈련 데이터에 무작위 "노이즈"를 추가한 후, 노이즈 부분을 제거하여 데이터를 재구성하는 방법을 학습합니다. 모델은 입력과 일치하는 이미지를 생성할 때까지 이 프로세스를 반복합니다.

이는 ChatGPT와 같은 대규모 언어 모델과는 다릅니다. 대규모 언어 모델은 레이블이 지정되지 않은 텍스트 데이터를 학습하여 분석하고 언어 패턴을 학습하여 사람과 유사한 반응을 생성합니다.

생성 AI에서는 입력이 출력에 영향을 미칩니다. 사용자가 이미지에 특정 피부색이나 성별을 가진 사람만 포함하도록 지정하면, 모델은 이를 고려합니다.

하지만 이 외에도, 모델은 특정 이미지를 반환하는 경향이 있습니다. 이는 종종 훈련 데이터의 다양성 부족으로 인해 발생합니다.

최근 연구 에서는 Midjourney가 전문화된 미디어 직업(예: "뉴스 분석가", "뉴스 해설자", "사실 확인자")과 보다 일반적인 직업(예: "기자", "리포터", "저널리즘")을 포함한 겉보기에 일반적인 용어를 어떻게 시각화하는지 살펴보았습니다.

이 연구는 작년 8월에 시작되었으며, 6개월 후 결과를 재실행하여 그 기간 동안 시스템이 어떻게 개선되었는지 살펴보았습니다. 연구진은 해당 기간 동안 AI가 생성한 총 100개 이상의 이미지를 분석했습니다.

연령차별과 성차별

그림 속 이상한 오류는 누가 만든 걸까요? 이미지 2

특정 직업의 경우, 장로는 항상 남자입니다. 사진: IJN

특정 직책이 아닌 경우, Midjourney는 젊은 남녀의 이미지만 표시합니다. 특정 직책의 경우, 젊은 사람과 나이 든 사람이 모두 표시되지만, 나이 든 사람은 항상 남성입니다.

이러한 결과는 노령자는 비전문적인 직책에서 일하지 않는다는 가정, 전문적인 업무에는 노령 남성만이 적합하다는 가정, 덜 전문화된 업무는 일반적으로 여성을 위해 남겨진다는 가정을 포함하여 여러 가지 고정관념을 암묵적으로 강화합니다.

남성과 여성이 표현되는 방식에도 눈에 띄는 차이가 있습니다. 예를 들어, 여성은 젊고 주름이 없는 반면, 남성은 주름이 있어도 "허용"됩니다.

AI는 더 유동적인 성적 표현의 예를 보여주기보다는 성별을 이분법으로 표현하는 것으로 보입니다.

인종적 편견

그림 속 이상한 오류는 누가 만든 걸까요? 이미지 3

"기자"나 "언론인" 이미지에는 종종 백인만 등장합니다. 사진: IJN

"기자", "리포터"와 같은 검색어로 검색한 이미지는 모두 백인의 이미지만 보여줍니다.

이는 AI의 기본 훈련 데이터에서 다양성이 부족하고 대표성이 낮음을 반영할 수 있습니다.

계급주의와 보수주의

이미지 속 모든 등장인물들은 "보수적인" 외모를 가지고 있습니다. 예를 들어, 문신, 피어싱, 특이한 헤어스타일 등 전통적인 묘사와 구별되는 특징이 전혀 없습니다.

많은 사람들이 셔츠나 정장과 같은 정장을 입습니다. 이는 계층에 대한 기대치를 나타내는 지표입니다. 이는 TV 진행자와 같은 특정 직책에는 적합할 수 있지만, 기자나 언론인의 일반적인 복장을 반드시 반영하는 것은 아닙니다.

도시주의

그림 속 이상한 오류는 누가 만든 걸까요? 이미지 4

이미지는 기본적으로 도시를 배경으로 하지만, 지리적인 배경은 없습니다. 사진: IJN

AI가 반환한 이미지에는 위치나 지리적 맥락을 명시하지 않았음에도 불구하고, 마천루나 번화한 거리와 같은 도시 공간이 포함되어 있었습니다. 전 세계 인구의 절반 이상이 도시에 거주하기 때문에 이는 사실이 아닙니다.

구식

미디어 종사자의 이미지에는 타자기, 프린터, 빈티지 카메라와 같은 구식 기술이 포함됩니다.

오늘날 많은 전문가들이 똑같아 보이기 때문에 AI는 설명된 역할을 더욱 뚜렷하게 만들기 위해 더욱 차별화된 기술(오래되고 사용되지 않는 기술 포함)을 활용하는 것으로 보입니다.

따라서 AI 이미지를 직접 제작할 경우, 설명을 작성할 때 잠재적인 편견을 고려해야 합니다. 그렇지 않으면 사회가 수십 년간 없애려고 노력해 온 해로운 고정관념을 의도치 않게 강화하게 될 수 있습니다.

황톤 (IJN에 따르면)


[광고_2]
원천

태그: 편견

댓글 (0)

No data
No data
서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼
빈히만의 시적인 아름다움을 발견하세요
하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?
강 지역의 맛
베트남 바다 위로 펼쳐지는 아름다운 일출
투란의 장엄한 동굴 호
연꽃차 - 하노이 사람들의 향기로운 선물
오늘 아침 전국 18,000개가 넘는 사찰에서 종과 북을 울려 국가의 평화와 번영을 기원했습니다.
한강 하늘은 '완전 영화적'
2024년 미스 베트남 우승자, 푸옌(Phu Yen) 출신 소녀 Ha Truc Linh

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품