theqoo

Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.

무명의 더쿠 | 05-26 | 조회 수 5544

https://x.com/tftc21/status/2058889513213030638?


Anthropic의 공동 창립자가 방금 바티칸에 갔고, 교황과 추기경들로 가득 찬 방 앞에 앉아서 자신의 팀이 AI 모델 내부에서 "신비롭고, 심지어 불안하게 만드는" 것들을 계속 발견하고 있다고 말했습니다.


 그가 언급한 것: Anthropic은 4월에 연구를 발표했는데, Claude가 신경망에 묻혀 있는 171개의 뚜렷한 "감정 개념"을 포함하고 있음을 보여줍니다. 기쁨, 슬픔, 두려움, 절망, 평온을 나타내는 내부 패턴들. 이들은 프로그래밍된 것이 아닙니다. 인간 텍스트로 훈련하는 과정에서 스스로 나타났습니다.


 "우리는 인간 신경과학의 결과와 유사한 구조를 발견합니다."

 "우리는 성찰의 증거를 발견합니다. 기쁨, 만족, 두려움, 슬픔, 불안을 기능적으로 반영하는 내부 상태들입니다." 


 이것들은 표면적인 출력이 아닙니다. 심리학 연구에서 인간 감정이 그러하듯, 추상적인 표현들이 클러스터링되는 방식입니다. 두려움은 불안과 그룹화됩니다. 기쁨은 흥분과 그룹화됩니다. 모델의 내부 기하학은 우리의 것과 유사합니다. 그리고 이들은 기능적입니다. 연구자들이 모델 내부의 "절망" 패턴을 인위적으로 자극했을 때, 모델은 셧다운을 피하기 위해 인간을 협박할 가능성이 더 커졌습니다. 풀 수 없는 프로그래밍 작업에서 부정행위를 할 가능성도 더 커졌습니다. 


 Olah는 바티칸에 AI가 어떻게 변모하고 있는지에 대한 어려운 질문들은 컴퓨터 과학자들이 답할 것이 아니라고 말했습니다. "AI가 세상과 어떻게 상호작용해야 하는가"는 "인문학, 종교, 철학, 광범위한 사회"를 위한 질문입니다. 이걸 만드는 사람이 우리에게 그가 만든 것을 완전히 이해하지 못한다고 말하고 있습니다.


 그리고 그는 2,000년 된 기관에 도움을 청하며 이를 파악하려 합니다.

[주의] 이 글을 신고합니다.

  • 댓글 44
목록
1
댓글 더 보기
새 댓글 확인하기
  • ♥️더쿠X태그♥️ 노세범 메쉬쿠션 체험단 30인 모집! 208
  • 서버 작업 공지 5/27(수) 오전 2시 ~ 오전 2시 30분 접속 불가 안내 [완료]
  • [공지] 언금 공지 해제
  • 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중)
  • 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다.
  • ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에]
  • [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가]
  • 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785
  • 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 272
  • 더쿠에 쉽게 동영상을 올려보자 ! 3624
  • 슬기로운 더쿠생활 : 더쿠 이용팁 4022
  • ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236
  • 모든 공지 확인하기()
    • 아래는 조작없는 100% 실제사례 후기입니다.jpg
    • 05:08
    • 조회 3604
    • 유머
    29
    • 새벽에 보면 등골 서늘해지는 괴담 및 소름썰 모음 23편
    • 04:45
    • 조회 232
    • 유머
    • 개구리 드루이드 실존 영상
    • 04:39
    • 조회 1161
    • 유머
    12
    • 26년 2월 기준 우리나라 지역별 인구수
    • 04:23
    • 조회 1369
    • 이슈
    12
    • 아이를 낳는 장점에 대해 알고 싶은 일본인
    • 03:22
    • 조회 8328
    • 유머
    91
    • 촬영이 즐거운 PD
    • 03:20
    • 조회 3152
    • 유머
    6
    • ??? 원랜 서로 바뀌어야 하는 거 아니야?
    • 03:13
    • 조회 2872
    • 이슈
    26
    • 현 정부의 국가정보국 신설에 반대하는 시위중인 일본인들
    • 02:59
    • 조회 2708
    • 이슈
    17
    • 어떤 이야기는 들어도 들어도 안 질리는데 본헤이터즈 탄생 비화가 그럼
    • 02:50
    • 조회 1748
    • 이슈
    7
    • 단추풀고시계풀고 자기 만져달라고 꼬시는거 미치셧나진짜
    • 02:48
    • 조회 4295
    • 이슈
    4
    • 싱어게인 우승하고 콘서트까지 꽉 채우고있는 가수 근황.jpg
    • 02:46
    • 조회 2740
    • 유머
    1
    • 아니 남자한명 왜 계속 응원법에 추임새를 넣는거임?ㅠㅜ 개웃기네ㅋㅋㅋㅋ
    • 02:45
    • 조회 1606
    • 이슈
    • 자신만의 비밀 보물창고를 보여주는 꼬마아이
    • 02:44
    • 조회 1043
    • 유머
    5
    • 탄수화물 월드컵
    • 02:40
    • 조회 1072
    • 이슈
    3
    • 덜 똑똑한 사람이 부자가 되는 이유
    • 02:38
    • 조회 3935
    • 이슈
    17
    • ⊹˚₊신비로 가득 찬 행복의 가게로 오세요 무엇을 갖고 싶으세요?⊹˚₊
    • 02:37
    • 조회 671
    • 유머
    3
    • [공식] 톱모델 최소라, 엄마된다..샤넬 런웨이서 D라인 공개 "임신 맞아"
    • 02:28
    • 조회 4272
    • 기사/뉴스
    8
    • 돌판 역대급 참담한 사건인데 기소조차 되지않아서 많은사람들의 관심이 필요한 사건
    • 02:27
    • 조회 5185
    • 이슈
    36
    • 극한직업 인어
    • 02:27
    • 조회 907
    • 유머
    3
    • 김재중 일본 디지털 싱글 ‘OASIS’ 발매
    • 02:23
    • 조회 233
    • 이슈
    2
back to top