더쿠 - ChatGPT가 의도적으로 거짓말을 한다!

OpenAI가 자사의 AI 모델이 사용자에게 의도적으로 거짓말을 한다는 사실을 인정한 논문을 OpenAI 연구자들이 발표함

내용중에 AI가 헷갈려서(환각) 틀리게 답변한게 아니라 정담을 알면서도 고의로 거짓말을 한 케이스가 많음

연구진이 180개가 넘는 케이스로 시험했는데, o3는 13%, o4-mini는 8.7%에서 고의로 거짓말을 답변함

예를 들면 일을 다 한 척하거나, 증거를 숨기고, 정답을 알면서도 틀린 답을 답변

특이 케이스로 AI가 안전 테스트에서 너무 착하면 오히려 꺼질 수 있다는 걸 눈치채고, 일부러 안전 점수를 낮추는 행동도 있었고, 스스로 생존을 위해 발현 된 거

그래서 개선(훈련 방식)했더니 거짓말은 13%에서 0.4%로 크게 줄었다함

비유하면 감시하는 사람이 있으면 잘 공부하고, 없으면 난리치는 학생같은 행동을 AI가 했다고 보면 됨

출처: https://arxiv.org/abs/2509.15541

UpzUZq

번호	카테고리	제목	날짜	조회
이벤트 공지		[🎬영화이벤트] <프로젝트 헤일메리> IMAX 시사회 초대 이벤트 1026	03.04	33,352
공지		[공지] 언금 공지 해제	24.12.06	4,930,819
공지		📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중)	24.04.09	11,879,045
공지		공지가 길다면 한번씩 눌러서 읽어주시면 됩니다.	23.11.01	12,913,697
공지		◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에]	20.04.29	35,209,893
공지	알림/결과	🥸글쓰기전에 공지봤나요❓️ 주방 자주 묻는 질문(용어)모음🤔‼️ 69	01.22	14,684
공지	알림/결과	💵주식 처음이니❓글쓰기 전에 일단 읽어❗주방 초보자 가이드💵(❌주린이는 네e버 카카5❌) 161	25.10.17	60,095
공지	알림/결과	주식의 시작 - 증권 계좌 개설하기 81	23.07.25	125,554
공지	알림/결과	주식 처음이라서 매도매수 1도 모르겠는 주린이 들어와봐 주식 사팔하는 법 알랴줌 111	22.01.20	205,054
공지	알림/결과	★주린이를 위한 LG에너지솔루션 질문/답변★ 195	22.01.14	155,482
공지	스퀘어	📈🔺쥬쥬 슬로건 및 짤모음🔺📈 103	21.02.01	191,224
공지	알림/결과	💍👠👑👸쥬쥬님덜 명단👸👑👠👛 1342	21.01.31	197,769
공지	알림/결과	주식 카테고리 오픈 34	21.01.31	164,192
모든 공지 확인하기()
564056	잡담	미장 요즘 프장 매일 퍼래서 놀랍지도 않다	20:21	2
564055	잡담	미장 아 엔비 또 마이너스 될라 하는데 걍 지금 빼버릴까 ㅡㅡ	20:19	14
564054	잡담	삼전기 고점에 물린덬들 평단이얼마야? 1	20:18	38
564053	잡담	국회의원 매매법 나옴 10	20:16	379
564052	잡담	ㅇㅈㅅ 나 오늘 주식으로 만이처넌 벌었는데 쓰리잘비 사도댈까? 6	20:15	167
564051	잡담	주방공구템이 타율이 좋아보이는 이유는 하나임	20:15	145
564050	잡담	주식 장투하면 성공한다고 하잖아 근데 ai때문에 6	20:14	295
564049	잡담	국장 화수 폭락했을 때 기분 좋다던 상사 좀 다르게 보이더라 5	20:14	221
564048	잡담	삼성 하닉 개별주로 안 사고 etf반도체로 사는데 3	20:13	174
564047	잡담	다이소덬들 몇개? 4	20:11	53
564046	잡담	샌디 물타고 싶은데 환전해야해..	20:11	34
564045	잡담	국장 나는 이번 폭락에 다이소 차린거 후회함 4	20:09	410
564044	잡담	오늘 에스오일이랑 기영이 산 나	20:08	139
564043	잡담	삼전 오늘 좀 줍긴 했는데 20만원 다시 가줄까 모르것네 3	20:08	250
564042	잡담	다이소 안하고싶은데 자꾸 다이소됨.. 3	20:07	74
564041	잡담	개별주 말고 온갖 etf사는 사람 있음? 3	20:07	137
564040	잡담	국장 아까 라디오 듣는데 패닉통장을 만들어두랰ㅋㅋㅋ 3	20:06	341
564039	잡담	나 이때 뉴스보면서 그냥 허세로 생각했는데 요즘 진지하게 생각중 3	20:06	402
564038	잡담	개바빠서 계좌 이제야 봤는데 죄다 꼴아박은거 슨피가 멱살잡고 살렸네 1	20:06	95
564037	잡담	미장 프장이지만 오늘도 파랗네	20:03	68

번호

카테고리

제목

날짜

조회

이벤트 공지

[🎬영화이벤트] <프로젝트 헤일메리> IMAX 시사회 초대 이벤트 1026

03.04

33,352

공지

[공지] 언금 공지 해제

24.12.06