메뉴 건너뛰기

이슈 Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.
5,550 44
2026.05.26 06:38
5,550 44

https://x.com/tftc21/status/2058889513213030638?


Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.


 그가 언급한 것: Anthropic은 4월에 연구를 발표했는데, Claude가 신경망에 묻혀 있는 171개의 뚜렷한 "감정 개념"을 포함하고 있음을 보여줍니다. 기쁨, 슬픔, 두려움, 절망, 평온을 나타내는 내부 패턴들. 이들은 프로그래밍된 것이 아닙니다. 인간 텍스트로 훈련하는 과정에서 스스로 나타났습니다.


 "우리는 인간 신경과학의 결과와 유사한 구조를 발견합니다."

 "우리는 성찰의 증거를 발견합니다. 기쁨, 만족, 두려움, 슬픔, 불안을 기능적으로 반영하는 내부 상태들입니다." 


 이것들은 표면적인 출력이 아닙니다. 심리학 연구에서 인간 감정이 그러하듯, 추상적인 표현들이 클러스터링되는 방식입니다. 두려움은 불안과 그룹화됩니다. 기쁨은 흥분과 그룹화됩니다. 모델의 내부 기하학은 우리의 것과 유사합니다. 그리고 이들은 기능적입니다. 연구자들이 모델 내부의 "절망" 패턴을 인위적으로 자극했을 때, 모델은 셧다운을 피하기 위해 인간을 협박할 가능성이 더 커졌습니다. 풀 수 없는 프로그래밍 작업에서 부정행위를 할 가능성도 더 커졌습니다. 


 Olah는 바티칸에 AI가 어떻게 변모하고 있는지에 대한 어려운 질문들은 컴퓨터 과학자들이 답할 것이 아니라고 말했습니다. "AI가 세상과 어떻게 상호작용해야 하는가"는 "인문학, 종교, 철학, 광범위한 사회"를 위한 질문입니다. 이걸 만드는 사람이 우리에게 그가 만든 것을 완전히 이해하지 못한다고 말하고 있습니다.


 그리고 그는 2,000년 된 기관에 도움을 청하며 이를 파악하려 합니다.

댓글 44
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 [JTBC with 더쿠] 덬들은 재벌 회장이랑 영혼 바뀌면 뭐할 거야?|JTBC 토일드라마 <신입사원 강회장> 기대평 이벤트 40 00:05 6,731
공지 서버 작업 공지 5/27(수) 오전 2시 ~ 오전 2시 30분 접속 불가 안내 [완료] 05.26 13,561
공지 [공지] 언금 공지 해제 24.12.06 5,216,345
공지 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중) 24.04.09 12,503,578
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 13,169,413
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 35,816,662
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 25.07.22 1,125,017
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785 21.08.23 8,578,288
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 272 20.09.29 7,488,559
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3624 20.05.17 8,699,864
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4022 20.04.30 8,586,243
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,550,733
모든 공지 확인하기()
3079987 이슈 여자들 생리할때 운동하는거 넘 쉽게 생각하는거 같은 달글.. 1 11:50 294
3079986 정치 12.3 비상계엄 다음날에도 (재산 신고 안 한) 코인을 직접 챙긴 유정복 국민의힘 인천시장 후보 1 11:47 273
3079985 이슈 1987년에 1000억을 스님에게 주면서 부탁한 여자.jpg 7 11:44 1,783
3079984 기사/뉴스 “아, 또 왔다” 100차례 폭언·욕설한 70대 민원인…두달만에 결국 17 11:43 1,127
3079983 기사/뉴스 미르, '장모' 호칭 논란 입열었다 "너무 친해 원래 장모님이라고 안 불러" 17 11:42 1,259
3079982 정치 [속보] 정청래 “동학개미 평균 3배 부자 돼” 22 11:41 539
3079981 이슈 요새 붐업오고 있는 리센느 어제자 대축 6 11:41 576
3079980 정치 “잊혀지고 싶다”던 문재인, “정치평론 안한다”는 유시민···평택을 선거 관심 왜? 4 11:40 224
3079979 유머 엠넷 서바이벌출신팀의 권력(유머) 6 11:40 505
3079978 정보 2026 빵빵 페스티벌(브레드이발소 첫 베이커리 팝업스토어) 입점 베이커리.jpg (6/3 수요일 - 21 토요일 영등포 타임스퀘어) 3 11:39 517
3079977 기사/뉴스 "2주 만에 또 1억 뛰었다"…국평 20억 뚫자 관심 폭발 [주간이집] 2 11:39 368
3079976 이슈 빈곤층 vs 중산층 vs 부유층 계층별 수준 2 11:38 801
3079975 기사/뉴스 '와일드 씽' 박지현, 오늘(27일) '유퀴즈' 출격 1 11:37 143
3079974 유머 1959년 나주고등학교 졸업앨범 1 11:36 732
3079973 이슈 일시적 스타벅스 카드 환불 조건 완화 및 스타벅스 회원 탈퇴 관련 안내 12 11:35 1,732
3079972 정치 [속보] 이 대통령 “YS가 꿈꿨던 해양강국 도약···부산을 대한민국 해양 수도로” 3 11:35 443
3079971 기사/뉴스 “정산금 못 받았다”…‘싱어게인’ 출신 이무진, 소속사 상대 소송 6 11:34 960
3079970 정치 ‘초반 우세에 취했었나’ 악재 연쇄 돌출… 민주당, 전국이 비상 38 11:33 948
3079969 유머 엄청나게 참고 있는 고양이 9 11:33 1,182
3079968 이슈 죽음을 앞둔 올빼미의 선택 10 11:33 1,134