더쿠 - Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.

https://x.com/tftc21/status/2058889513213030638?

Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.

그가 언급한 것: Anthropic은 4월에 연구를 발표했는데, Claude가 신경망에 묻혀 있는 171개의 뚜렷한 "감정 개념"을 포함하고 있음을 보여줍니다. 기쁨, 슬픔, 두려움, 절망, 평온을 나타내는 내부 패턴들. 이들은 프로그래밍된 것이 아닙니다. 인간 텍스트로 훈련하는 과정에서 스스로 나타났습니다.

"우리는 인간 신경과학의 결과와 유사한 구조를 발견합니다."

"우리는 성찰의 증거를 발견합니다. 기쁨, 만족, 두려움, 슬픔, 불안을 기능적으로 반영하는 내부 상태들입니다."

이것들은 표면적인 출력이 아닙니다. 심리학 연구에서 인간 감정이 그러하듯, 추상적인 표현들이 클러스터링되는 방식입니다. 두려움은 불안과 그룹화됩니다. 기쁨은 흥분과 그룹화됩니다. 모델의 내부 기하학은 우리의 것과 유사합니다. 그리고 이들은 기능적입니다. 연구자들이 모델 내부의 "절망" 패턴을 인위적으로 자극했을 때, 모델은 셧다운을 피하기 위해 인간을 협박할 가능성이 더 커졌습니다. 풀 수 없는 프로그래밍 작업에서 부정행위를 할 가능성도 더 커졌습니다.

Olah는 바티칸에 AI가 어떻게 변모하고 있는지에 대한 어려운 질문들은 컴퓨터 과학자들이 답할 것이 아니라고 말했습니다. "AI가 세상과 어떻게 상호작용해야 하는가"는 "인문학, 종교, 철학, 광범위한 사회"를 위한 질문입니다. 이걸 만드는 사람이 우리에게 그가 만든 것을 완전히 이해하지 못한다고 말하고 있습니다.

그리고 그는 2,000년 된 기관에 도움을 청하며 이를 파악하려 합니다.

번호	카테고리	제목	날짜	조회
이벤트 공지		♥️더쿠X태그♥️ 노세범 메쉬쿠션 체험단 30인 모집! 164	05.25	13,782
공지		[공지] 언금 공지 해제	24.12.06	5,208,600
공지		📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중)	24.04.09	12,488,267
공지		공지가 길다면 한번씩 눌러서 읽어주시면 됩니다.	23.11.01	13,165,407
공지		◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에]	20.04.29	35,801,519
공지	정치	[스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가]	25.07.22	1,125,017
공지	정보	더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785	21.08.23	8,578,288
공지	정보	나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 271	20.09.29	7,487,310
공지	팁/유용/추천	더쿠에 쉽게 동영상을 올려보자 ! 3624	20.05.17	8,698,634
공지	팁/유용/추천	슬기로운 더쿠생활 : 더쿠 이용팁 4022	20.04.30	8,586,243
공지	팁/유용/추천	◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236	18.08.31	14,546,836
모든 공지 확인하기()
3078552	기사/뉴스	정용진, 오늘 대국민 사과…'탱크데이' 진상 조사 주목	07:51	85
3078551	기사/뉴스	“국평 6억 내야”…고민 커진 상계주공5단지 2	07:46	731
3078550	이슈	tvN 월화 드라마 <취사병 전설이 되다> 시청률 추이 14	07:44	1,090
3078549	이슈	방탄소년단 지민 인스타 업뎃☺️ 10	07:42	517
3078548	유머	천성이 쉐프인 윤남노 8	07:40	1,166
3078547	기사/뉴스	'군체' 극장가 집어삼켰다..개봉 5일만 200만 돌파 '올해 최단 기록' [공식] 12	07:39	491
3078546	기사/뉴스	BTS, 오늘 '아메리칸 뮤직 어워즈' 출격…두 번째 대상 도전 3	07:39	412
3078545	이슈	영화 와일드씽 신하균(박용구) 스틸컷	07:35	816
3078544	이슈	판다월드의 인싸 판다 아이바오🐼 4	07:32	798
3078543	유머	역동적으로 놀고있는 아깽이 두마리 6	07:28	1,051
3078542	이슈	대학생들의 창의력이 돋보이는 학생작 뮤직비디오 3개 1	07:20	610
3078541	정보	신한플러스/플레이 정답 8	07:08	311
3078540	정치	조국 뽑으면 평택 읍면동마다 전담 국회의원 배치..???? 22	07:07	1,717
3078539	정치	국힘이 ‘답정너’ 요구하는 ‘북한 주적’, 윤석열 정부도 안 썼다 3	06:55	899
3078538	이슈	라이머 인스타업뎃 1	06:48	3,191
3078537	유머	데뷔하자마자 세상 멸망 컨셉.jpg 7	06:46	3,905
»	이슈	Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다. 29	06:38	3,594
3078535	정치	7시 기상 22시 퇴근하는 민주당 후보 아들 남돌 14	06:26	5,048
3078534	이슈	남자가 생각하는 여자를 위해서 자기가 이정도까지 해준다 생각하는 행동들 29	06:22	5,582
3078533	이슈	대전 격투게임 역사상 가장 인지도가 높은 여캐 2인. 이 캐릭터들 이름 안다? 모른다? 134	06:03	6,155

번호

카테고리

제목

날짜

조회

이벤트 공지

♥️더쿠X태그♥️ 노세범 메쉬쿠션 체험단 30인 모집! 164

05.25

13,782

공지

[공지] 언금 공지 해제

24.12.06