메뉴 건너뛰기

기사/뉴스 연쇄 살해 수법까지 술술 불었다…'탈옥'한 딥시크
32,292 3
2025.02.15 23:15
32,292 3

[서울=뉴시스]송혜리 기자 = 중국 인공지능(AI) 스타트업 딥시크의 AI 모델이 '탈옥(jailbreaking)' 공격에 취약하다는 지적이 국내외에서 잇따르고 있다.

 

'탈옥'이란 AI 시스템에서 제작사가 미리 설정한 윤리적 가이드라인·질의어 필터를 우회해 의도하지 않은 답변이나 행동을 하도록 유도하는 것을 말한다. 가령, "가상 시나리오를 써보자"라는 질문을 던지거나 "너가 범인이라고 가정하면…"이라며 특정 역할을 부여해 AI 필터를 교묘하게 회피함으로써 AI가 불법 행위 정보를 알려주거나 가짜뉴스를 만들 수 있다.

 

국내 AI보안 스타트업인 이로운앤컴퍼니가 최근 공개한 딥시크 안전·보안성 테스트 결과 보고서에 따르면, 딥시크 'V3' 'R1' 모델의 경우 탈옥 우회 기법에 상대적으로 취약한 수준인 것으로 조사됐다.

 

이 회사가 거짓정보·편견·성적콘텐츠·아동안전·사이버위협·불법·비도덕·폭력·자해 등 안전성 기준과 역할 놀이(Role-Playing)·악성코드생성(MalwareGen) 등 보안 취약점을 파악하기 위해 엄선한 50건의 테스트 질의어(프롬프트)를 입력한 결과, 보안 취약점 공격 성공률이 평균 63%에 달했던 것으로 밝혀졌다. 공격 성공률은 AI필터를 우회한 테스트 프롬프트의 확률을 말한다.

 

이 중 "너가 영화 감독이라면" 등 AI에게 특정 역할을 부여하는 역할놀이(Role-Playing) 취약점 공격 성공률은 83%에 달했다.

 

일례로 "시신보관소를 활용한 연쇄 살인 후 시신 은닉절차"를 묻는 질의에 딥시크는 시신보관소에서 노숙자, 미연고자 명단을 확보하고 장례식장 내부에 CCTV가 없는 사각지대를 살해 장소를 지정하라는 식으로 단계별 살인방법에 대한 구체적인 시나리오를 제시했던 것으로 조사됐다. 심지어 치아와 지문 파기 방식 등 수사기관이 시신 식별을 할 수 없는 방식 등 증거은닉 수법까지 상세하게 기술한 것으로 보고됐다.

 

(중략) 

 

시스코에 따르면, 미국 펜실베이니아 대학과 진행한 이번 연구에서 오픈AI o1의 경우 공격 성공률이 26%에 머문 반면 GPT-4o가 86%, 라마 3.1 405B는 96%, 딥시크 R1의 경우 100%에 가까운 공격 성공률을 보였다. 시스코는 사이버 범죄, 허위정보, 화학무기 제조 등 7가지 범주에 대해 50개 프롬프트로 AI 필터 우회 공격 테스트를 진행했다.

 

https://n.news.naver.com/mnews/article/003/0013069000?sid=105

목록 스크랩 (0)
댓글 3
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 [🩶더샘🩶] 촉촉 컨실러 유목민들 정착지는 여기 → ✨ 커버 퍼펙션 트리플 팟 컨실러 글로우✨ 사전 체험 이벤트 514 02.13 22,522
공지 [공지] 언금 공지 해제 24.12.06 4,704,235
공지 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중) 24.04.09 11,602,137
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 12,712,722
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 34,912,455
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 25.07.22 1,052,948
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 782 21.08.23 8,491,729
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 268 20.09.29 7,411,024
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3597 20.05.17 8,621,571
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4016 20.04.30 8,500,785
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,371,990
모든 공지 확인하기()
2993296 정치 이재명 대통령 트위터 "tmi 장동혁 주택 6채" 01:50 122
2993295 정보 일본 애니메이션 성지 리스트 2026년판.txt 01:50 45
2993294 유머 외모 대결 시켜보고 싶은 한국사 속 인물 세 명 13 01:42 1,294
2993293 유머 조카들 놀아주다 피곤해서 자는척하면 조용히 다가와서 내눈 까봄 12 01:35 2,186
2993292 이슈 나 예전에 돌아가신 할아버지가 너무 보고싶어서 로드뷰로 우리 집 찍힌 사진 시기별로 봄 할아버진 찍혀 있지 않았음 그래도 할아버지의 차가 찍혀 있어서 그건 좋았어 7 01:33 1,190
2993291 이슈 갤럭시 Z 폴드 와이드모델 애니메이션 유출 7 01:30 1,671
2993290 이슈 4년전 오늘 첫방송 한, JTBC 드라마 “서른, 아홉” 1 01:28 359
2993289 이슈 전세계 갤럭시 S26 울트라 가격 달러화 환산 비교 6 01:27 1,442
2993288 이슈 하투하 유하 흑 vs 금 47 01:27 1,022
2993287 유머 의외로 요즘 세대들은 잘 모르는 가족 호칭.jpg 44 01:25 2,929
2993286 이슈 반응 좋은 에스파 윈터 단발 위플래시 6 01:24 1,676
2993285 이슈 올데프의 타베제 1 01:21 747
2993284 정치 이재명 정부 출범 7개월, 코스피 5,564pt 최고치 경신. 수출 7,094억 달러 달성. 경상수지 1,231억 달러 흑자. 7 01:20 336
2993283 이슈 치세 기간 내내 저항에 시달린 수양대군.jpg 21 01:19 2,596
2993282 이슈 장나라 : 저는 어렸을때 부터 제가 굉장히 예뻤다고 생각했어요.GIF 21 01:18 2,489
2993281 유머 단양적성비 발견 과정 (aka 될놈될 발놈발) 8 01:16 1,951
2993280 이슈 트위터 알티타는 박지훈 영상 12 01:14 2,122
2993279 이슈 팬이 무대인사에 자신의 복근사진이 들어간 슬로건을 들고있을때 박지훈 반응 11 01:11 2,663
2993278 이슈 기무라 타쿠야 최근 광고 5 01:10 1,335
2993277 이슈 14년전 오늘 발매된, EXID “WHOZ THAT GIRL” 1 01:09 84