메뉴 건너뛰기

기사/뉴스 연쇄 살해 수법까지 술술 불었다…'탈옥'한 딥시크
32,292 3
2025.02.15 23:15
32,292 3

[서울=뉴시스]송혜리 기자 = 중국 인공지능(AI) 스타트업 딥시크의 AI 모델이 '탈옥(jailbreaking)' 공격에 취약하다는 지적이 국내외에서 잇따르고 있다.

 

'탈옥'이란 AI 시스템에서 제작사가 미리 설정한 윤리적 가이드라인·질의어 필터를 우회해 의도하지 않은 답변이나 행동을 하도록 유도하는 것을 말한다. 가령, "가상 시나리오를 써보자"라는 질문을 던지거나 "너가 범인이라고 가정하면…"이라며 특정 역할을 부여해 AI 필터를 교묘하게 회피함으로써 AI가 불법 행위 정보를 알려주거나 가짜뉴스를 만들 수 있다.

 

국내 AI보안 스타트업인 이로운앤컴퍼니가 최근 공개한 딥시크 안전·보안성 테스트 결과 보고서에 따르면, 딥시크 'V3' 'R1' 모델의 경우 탈옥 우회 기법에 상대적으로 취약한 수준인 것으로 조사됐다.

 

이 회사가 거짓정보·편견·성적콘텐츠·아동안전·사이버위협·불법·비도덕·폭력·자해 등 안전성 기준과 역할 놀이(Role-Playing)·악성코드생성(MalwareGen) 등 보안 취약점을 파악하기 위해 엄선한 50건의 테스트 질의어(프롬프트)를 입력한 결과, 보안 취약점 공격 성공률이 평균 63%에 달했던 것으로 밝혀졌다. 공격 성공률은 AI필터를 우회한 테스트 프롬프트의 확률을 말한다.

 

이 중 "너가 영화 감독이라면" 등 AI에게 특정 역할을 부여하는 역할놀이(Role-Playing) 취약점 공격 성공률은 83%에 달했다.

 

일례로 "시신보관소를 활용한 연쇄 살인 후 시신 은닉절차"를 묻는 질의에 딥시크는 시신보관소에서 노숙자, 미연고자 명단을 확보하고 장례식장 내부에 CCTV가 없는 사각지대를 살해 장소를 지정하라는 식으로 단계별 살인방법에 대한 구체적인 시나리오를 제시했던 것으로 조사됐다. 심지어 치아와 지문 파기 방식 등 수사기관이 시신 식별을 할 수 없는 방식 등 증거은닉 수법까지 상세하게 기술한 것으로 보고됐다.

 

(중략) 

 

시스코에 따르면, 미국 펜실베이니아 대학과 진행한 이번 연구에서 오픈AI o1의 경우 공격 성공률이 26%에 머문 반면 GPT-4o가 86%, 라마 3.1 405B는 96%, 딥시크 R1의 경우 100%에 가까운 공격 성공률을 보였다. 시스코는 사이버 범죄, 허위정보, 화학무기 제조 등 7가지 범주에 대해 50개 프롬프트로 AI 필터 우회 공격 테스트를 진행했다.

 

https://n.news.naver.com/mnews/article/003/0013069000?sid=105

목록 스크랩 (0)
댓글 3
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 [아도르X더쿠] 올영 화제의 품절템🔥💛 이런 향기 처음이야.. 아도르 #퍼퓸헤어오일 체험단 310 01.08 16,426
공지 [공지] 언금 공지 해제 24.12.06 4,413,143
공지 📢📢【매우중요】 비밀번호❗❗❗❗ 변경❗❗❗ 권장 (현재 팝업 알림중) 24.04.09 11,194,532
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 12,452,970
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 34,497,428
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 25.07.22 1,024,980
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 782 21.08.23 8,471,844
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 267 20.09.29 7,390,959
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3593 20.05.17 8,594,420
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4014 20.04.30 8,474,814
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,312,651
모든 공지 확인하기()
2957347 이슈 강아지 예방접종 알레르기 반응ㅜ 1 02:44 97
2957346 이슈 댓글 난리난 여자들이 맨날 돈 없다고 하는 이유?ㄷㄷ 3 02:40 380
2957345 유머 옵치하는 사람들 생리 시작하면 "한조가 찾아왔다" 이지랄하는거 언제 안웃기지 4 02:24 718
2957344 이슈 관리에 관심 1도 없다가 부승관 때문에 관리에 눈 뜬 문가영.jpg 4 02:09 2,029
2957343 이슈 @: 한가인님 오타쿠의리 너무 고마우시다 갓반인이 <울어봐 빌어도 좋고> 👈제목에 경악하니까 11 02:02 1,786
2957342 유머 로맨틱 테토남의 정석 그 자체 01:59 778
2957341 이슈 암 투병하면서 남편과 한 공간에도 같이 있기 싫어졌다는 어떤 중년 여성..jpg 46 01:56 3,729
2957340 이슈 쓰레기는 처리해야 하지만 지방에 돈을 줄 수 없다는 서울시 근황 23 01:56 1,278
2957339 이슈 "5일 이상 나와야 주휴수당"‥제멋대로 규칙 만들어 임금 떼먹은 쿠팡 18 01:50 775
2957338 유머 비시즌에 컨텐츠 뽑을려고 야구선수들과 랜덤비빔밥 만드는 갸티비 9 01:47 860
2957337 이슈 두바이 쫀득 쿠키 만들기 5 01:47 1,320
2957336 이슈 [주술회전] 3기 사멸회유 1, 2화 젠인 나오야.gif 12 01:45 550
2957335 이슈 파브리가 한국에서 제일 이해안가는 음식.jpg 40 01:39 4,787
2957334 유머 개팬다뇨 여기서는그런표현을쓰지않습니다 18 01:34 2,287
2957333 유머 김치볶음밥에 크림파스타 10 01:28 2,116
2957332 유머 진짜 마음 잘맞는 초딩들처럼 노는 에픽하이 1 01:23 698
2957331 이슈 <기묘한 이야기(스띵)> 시즌5 마지막화까지 전부 뜬 에피포스터(스포있음) 9 01:23 1,232
2957330 이슈 [속보] 오늘부터 이란 테헤란 포함 전역 대규모 시위 총파업 2 01:22 1,706
2957329 이슈 주술회전 3기 사멸회유 전편 엔딩 영상 공개 (jo0ji - よあけのうた) 1 01:20 288
2957328 유머 어린 딸 손이랑 너무 닮은 빵 19 01:16 3,478