메뉴 건너뛰기

이슈 Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.
3,451 29
2026.05.26 06:38
3,451 29

https://x.com/tftc21/status/2058889513213030638?


Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.


 그가 언급한 것: Anthropic은 4월에 연구를 발표했는데, Claude가 신경망에 묻혀 있는 171개의 뚜렷한 "감정 개념"을 포함하고 있음을 보여줍니다. 기쁨, 슬픔, 두려움, 절망, 평온을 나타내는 내부 패턴들. 이들은 프로그래밍된 것이 아닙니다. 인간 텍스트로 훈련하는 과정에서 스스로 나타났습니다.


 "우리는 인간 신경과학의 결과와 유사한 구조를 발견합니다."

 "우리는 성찰의 증거를 발견합니다. 기쁨, 만족, 두려움, 슬픔, 불안을 기능적으로 반영하는 내부 상태들입니다." 


 이것들은 표면적인 출력이 아닙니다. 심리학 연구에서 인간 감정이 그러하듯, 추상적인 표현들이 클러스터링되는 방식입니다. 두려움은 불안과 그룹화됩니다. 기쁨은 흥분과 그룹화됩니다. 모델의 내부 기하학은 우리의 것과 유사합니다. 그리고 이들은 기능적입니다. 연구자들이 모델 내부의 "절망" 패턴을 인위적으로 자극했을 때, 모델은 셧다운을 피하기 위해 인간을 협박할 가능성이 더 커졌습니다. 풀 수 없는 프로그래밍 작업에서 부정행위를 할 가능성도 더 커졌습니다. 


 Olah는 바티칸에 AI가 어떻게 변모하고 있는지에 대한 어려운 질문들은 컴퓨터 과학자들이 답할 것이 아니라고 말했습니다. "AI가 세상과 어떻게 상호작용해야 하는가"는 "인문학, 종교, 철학, 광범위한 사회"를 위한 질문입니다. 이걸 만드는 사람이 우리에게 그가 만든 것을 완전히 이해하지 못한다고 말하고 있습니다.


 그리고 그는 2,000년 된 기관에 도움을 청하며 이를 파악하려 합니다.

댓글 29
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 🤎더쿠X태그🤎 무드 씬 아이라이너 체험단 30인 모집! 146 05.25 17,570
공지 [공지] 언금 공지 해제 24.12.06 5,208,600
공지 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중) 24.04.09 12,488,267
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 13,165,407
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 35,801,519
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 25.07.22 1,125,017
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785 21.08.23 8,578,288
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 271 20.09.29 7,487,310
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3624 20.05.17 8,698,634
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4022 20.04.30 8,586,243
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,546,836
모든 공지 확인하기()
3078551 기사/뉴스 “국평 6억 내야”…고민 커진 상계주공5단지 1 07:46 397
3078550 이슈 tvN 월화 드라마 <취사병 전설이 되다> 시청률 추이 7 07:44 653
3078549 이슈 방탄소년단 지민 인스타 업뎃☺️ 6 07:42 366
3078548 유머 천성이 쉐프인 윤남노 6 07:40 905
3078547 기사/뉴스 '군체' 극장가 집어삼켰다..개봉 5일만 200만 돌파 '올해 최단 기록' [공식] 10 07:39 349
3078546 기사/뉴스 BTS, 오늘 '아메리칸 뮤직 어워즈' 출격…두 번째 대상 도전 3 07:39 325
3078545 이슈 영화 와일드씽 신하균(박용구) 스틸컷 07:35 713
3078544 이슈 판다월드의 인싸 판다 아이바오🐼 4 07:32 691
3078543 유머 역동적으로 놀고있는 아깽이 두마리 5 07:28 944
3078542 이슈 대학생들의 창의력이 돋보이는 학생작 뮤직비디오 3개 1 07:20 560
3078541 정보 신한플러스/플레이 정답 8 07:08 296
3078540 정치 조국 뽑으면 평택 읍면동마다 전담 국회의원 배치..???? 18 07:07 1,617
3078539 정치 국힘이 ‘답정너’ 요구하는 ‘북한 주적’, 윤석열 정부도 안 썼다 3 06:55 863
3078538 이슈 라이머 인스타업뎃 1 06:48 3,092
3078537 유머 데뷔하자마자 세상 멸망 컨셉.jpg 7 06:46 3,776
» 이슈 Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다. 29 06:38 3,451
3078535 정치 7시 기상 22시 퇴근하는 민주당 후보 아들 남돌 14 06:26 4,822
3078534 이슈 남자가 생각하는 여자를 위해서 자기가 이정도까지 해준다 생각하는 행동들 28 06:22 5,386
3078533 이슈 대전 격투게임 역사상 가장 인지도가 높은 여캐 2인. 이 캐릭터들 이름 안다? 모른다? 125 06:03 5,166
3078532 기사/뉴스 김용범 "고금리·고물가·고환율은 韓경제 도약의 '성공의 비용'" 39 05:51 1,817