메뉴 건너뛰기

정보 알파고가 보면 죽는 사진 : 적대적 공격
5,069 61
2020.08.21 23:03
5,069 61

blit.jpg

데이비드 랭포드의 SF 소설에 등장하는 "블릿(BLIT)." 프랙탈 구조를 띄고 있는 이 이미지는 설정상 인간이 맨눈으로 보게 되면 뇌에 과부하가 일어나 죽는다.

 

"보면 죽는 사진," "들으면 죽는 단어," "보면 미쳐버리는 괴물" 같은 설정들은 SF나 코스믹 호러 장르를 좋아하는 친구들이면 익숙한 설정이야. 아무것도 모른채 있다가 알아차리는 것만으로도 무력하게 죽어버린다는게 무서운 포인트지. 넷플릭스의 "버드 박스"나 유명한 일본의 "쿠네쿠네" 괴담같이 말이야.

 

그런데 과연 현실적으로 이런 인지만으로도 사람을 죽이는 물건이나 괴물을 만드는게 가능할까?

 

놀랍게도 인간을 죽이는건 없지만, 인간의 신경망을 러프하게 본뜬 인공신경망 기반 기계학습 모델은 실제로 입력값에 사람은 눈치채지도 못할만한 값을 절묘하게 집어넣는거만으로도 완전히 망가뜨릴수 있어.

 

이게 지금부터 소개할 적대적 공격(adversarial attack) 이라는 기계학습 AI를 상대로 한 해킹기법이야. 이름 참 더럽게 비직관적이지? 얼마나 인지도가 없으면 한국 공식 번역명조차 없어. 이해가 안가... 이렇게 재밌는 개념이 왜 안알려져있지?

 

예시

AA1.png

 

왼쪽 사진을 보면 인공지능이 사진에 있는게 돼지라는걸 인식하지만, 중간에 있는 노이즈(처럼 보이지만 아닌) 픽셀값들을 더해서 나온 결과물을 다시 집어넣으면 엉뚱하게도 "여객기"라고 인식하는걸 볼수있어. 사람 눈에는 전혀 구별이 안되는데 말이야.

 

fooled_featured.png

이건 2017년에 개발된 one pixel attack 이라는건데... 보는거와 같이 픽셀 딱 하나의 값을 의도적으로 바꾼것만으로 인공지능을 완전히 곱창내버리는걸 볼수있어.

 

lang1.png

 

이번엔 보면 죽는 이미지가 아니라 들으면 미치는 단어야. 리뷰를 분석해서 긍정적인 반응인지 부정적인 반응인지를 판단하는 AI 가 있는데, 긍정적인 형용사와 미사여구로 떡칠되어있는 영어 문장에 "zoning tapping fiennes" 를 어두에 삽입하자 바로 부정적인 리뷰라고 인지하는걸 볼수 있어(positive=>negative).

 

"근데 이거 그냥 난수 무작위생성해서 끼워넣으면 이렇게 되는거 아님? AI 좃밥이네ㅋㅋ" 라고 할수 있는데 절대 아님. 딥러닝 모델 해킹한답시고 아무생각없이 무작위 난수 집어넣으면 100% 막힘. 대부분의 딥러닝 AI는 개발자가 개병신처럼 데이터를 쓰레기장에서 주워왔거나 산업스파이가 아닌이상 앵간한 노이즈는 무시할줄 알아. 애초에 딥러닝의 수많은 개발목적중 하나가 이런 노이즈 면역도 있었음(Robustness). 그러면 이 개발자들은 어떻게 저 픽셀값이 이미지 인식을 망가트리고 저 세 단어가 결과값을 완전히 뒤집는다는걸 알았을까?

 

원리(비전공자 ver.)

답은 바로 기계학습 AI를 해킹하는 기계학습 AI를 만들고 학습시키는거야. 이 글에서는 대부분의 실사례처럼 타겟 AI의 내부구조를 전혀 모르고(black-box), 타겟 AI에 대한 무제한 접근이 허용되어있다고 가정하고 갈게. 알고리즘은 요약하자면 다음과 같아.

 

1. 입력값(배열, 이미지, 문장, 기타등등..)에 약간의 변동(픽셀값 추가, 단어 추가, etc..)을 줘서 오염시킨다

2. 오염된 값을 타겟 AI한테 먹여본다

3. 타겟 AI가 뱉어낸 답이 정답보다 최대한 멀어지게 변동을 주도록 학습시킨다

4. 어느정도 성능이 확보되면 학습을 멈추고 실전투입

 

설명이 이게 다냐고? 응 이게 다야

어차피 여기서 더 뇌절하면 뒤로가기 누를꺼잖아

일단은 이정도까지만 설명할테니 디테일하게 궁금한거 있으면 댓글에 ㄱㄱ 해줘

의의/시사점

 

그래서 이걸 어따 써먹냐고?

 

app1.png

 

 

 

위에서 말한 데이비드 랭포드의 SF 소설에서는 BLIT 개발로 인해 테러리스트의 무기도 총에서 스텐실판과 스프레이 깡통으로 바뀌었다고 하는데, 이런 소설이 미래에서는 현실이 될수 있어. 자율주행자동차가 대중화되었을때 만약에 어떤 미친놈이 반투명 셀로판지에 저걸 프린트해서 표지판에 붙히고 다닌다면? 상상도 못할 규모의 추돌사고가 일어나겠지.

 

audio.jpg

완전한 사물인터넷 시대가 도래하고 이제 집문마저 음성인식으로 열리는 시대가 됐다고 하자. 강도가 위와 같은 음성파일을 녹음기에 틀고 문앞에서 대화를 유도하지. 그리고 어쩔줄 몰라 아무 생각없이 던진 "How are you?" 한마디가 "open the door"로 인식이 되어 집문이 열려버리고... 

 

그 유명한 유튜브 알고리즘도 사실 wide-and-deep 기법을 쓴 딥러닝 모델이기 때문에 썸네일에 미세한 변동을 줘서 추천동영상에 뜨게 만드는것도 가능하지 않을까?

 

더 무서운 응용방법은 투자은행이나 헤지펀드들의 기업/주가 분석 AI에 adversarial attack을 거는거야. 사람이 보기엔 다 뒤져가는 기업인데 기계가 보기엔 1년내에 개떡상하는 기업이라고 판단하게 만들어 버리면 이게 4차산업시대의 네오-금융사기가 아니고 뭐겠어?

 

미래에는 인간이 알파고를 상대로 바둑에서 승리하는 유일한 방법은 이것밖에 안남을지도 몰라. 수싸움에서 이기는게 아니라 신경망에 버그를 내는 수를 둬서 이기는거지. 사실 이세돌의 신의 한수 78수는 adversarial attack이 아니였을까?

 

싸이버펑크 2077에 adversarial attack 있었으면 좋겠다.

이 글을 쓰게 된 계기는 ㄹㅇ 이거였음.

 

사이버펑크 2077에 구현되어있었으면 좋겠다. 만약에 진짜로 되어있으면 뭘 할수있을까? 막 주인공이 프린트된 사진을 CCTV에 쓰윽 들이밀어서 고장낸다거나 기계 뇌를 달고있는 적들한테 단어 몇마디 날려서 죽이는것도 될텐데...

 

이런 생각이 꼬리에 꼬리를 물고 늘어지다 보니 은근히 재밌어서 이 글까지 쓰게 됐음.

 

그리고 굳이 전공자급 지식이 필요한 개념이 아닌데도 불구하고 이렇게 묻혀있는게 너무 억울해서 써봄

 

만약에 데이터과학/머신러닝쪽을 파고있는 개붕이들이라면 adversarial attack에 관심을 가져보는건 어떨까? 아는 사람이 없어서 논문 쓸거리도 많아!

개드립 - 알파고가 보면 죽는 사진: 적대적 공격(adversarial attack) ( https://www.dogdrip.net/275950650 )

목록 스크랩 (39)
댓글 61
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 [아윤채X더쿠] #여름두피쿨링케어 ‘리밸런싱 스파클링 에센스’ 체험단 (100인) 595 04.29 108,840
공지 [공지] 언금 공지 해제 24.12.06 5,129,308
공지 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중) 24.04.09 12,345,953
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 13,110,052
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 35,637,877
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 25.07.22 1,109,739
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785 21.08.23 8,562,699
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 270 20.09.29 7,465,727
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3618 20.05.17 8,679,757
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4020 20.04.30 8,569,027
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,516,400
모든 공지 확인하기()
152798 이슈 동남아에서 Kpop과 서양팝의 후퇴와 로컬팝의 부상 56 16:13 3,232
152797 이슈 화살 쏴 친구 실명시킨 초등생, 교사도 공동책임 2억 3200만원 배상에 대한 팩트체크 61 16:06 3,900
152796 이슈  [유미의 세포들] 구웅 결혼식 복장 차이 278 15:49 23,112
152795 이슈 멧갈라에서 카리나에게 지수라고 하는 기자들 104 15:44 13,656
152794 유머 [소라와진경]팬티빨래 견해차이 덬들은 손빨래?세탁기? 183 15:34 7,033
152793 유머 [KBO] 초유의 사태 시구자 시구 포기, 현장에서 시구자 교체 396 14:53 46,292
152792 이슈 남편 사용설명서 598 14:49 35,541
152791 이슈 여자애 반찬을 뺏어먹던 남자아이의 실상... 220 14:37 43,229
152790 유머 댓글 난리난 서인영 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ.jpg 218 14:17 55,691
152789 기사/뉴스 [속보] 광주서 여고생 살해후 도주한 20대男 잡았다…“말다툼하다 흉기” 516 13:43 44,565
152788 이슈 내 취미: 인스타 여혐댓 좋아요 누른 한남들 여친 소환하기 636 13:25 61,171
152787 유머 지금 이렇게 대처하면 케톡플 어떨지 궁금한 SM의 1차원적 문제 대응 247 13:16 25,999
152786 이슈 [KBO] 팬들 향해 고개 숙인 고승민 나승엽 김세민 238 13:07 24,916
152785 이슈 6살 연하 여친과 데이트 비용 문제.jpg 373 12:55 50,596
152784 이슈 [KBO] 김경문 한화 감독: “20년 감독 하면서 이런 일은 처음...우는 동주 보면서 나도 많이 마음이 아팠다” 341 12:49 25,271
152783 유머 느끼한 회 삼대장 호불호 432 12:34 39,532
152782 이슈 멧갈라에서 만난 블랙핑크 멤버들.jpg 195 12:28 39,741
152781 이슈 어린이날 에버랜드 근황 117 12:26 35,797
152780 이슈 방금 뜬 아이브 어린이날 new 과거사진👧🏻 96 12:09 17,151
152779 정보 요즘 까치가 왜 안보이나 했더니( 6천원에 포획되어서 살처분) 476 12:08 43,023