https://x.com/bearlyai/status/2041594954347377129?s=20
Anthropic의 새로운 프론티어 모델(Mythos)은 지난 몇 주 동안 “모든 주요 OS와 모든 주요 웹 브라우저”를 포함해 수천 개의 제로데이 취약점을 발견했습니다. 이 모델은 “Linux 커널에서 여러 취약점을 자율적으로 찾아서 체인으로 연결했습니다.” 아마도 모델을 보류하는 이유일 겁니다.
미토스란?
클로드 개발한 회사에서 만든 현존하는 모든 주요 시스템, OS(윈도우 리눅스)를 뚫고 들어갈 수 있는 공격 포인트= 취약점을 순식간에 찾아내는 초고성능 모델
클로드 회사가 >>너무 위험하다<<는 이유로 공개를 미룸
그게 이번에 >>악용을 막기 위해 전세계 최상위 대기업 50곳<< 에만 공급되기로 함 구글 마이크로소프트등
그리고 오늘
https://x.com/TukiFromKL/status/2041612924297392453?s=20
Anthropic이 방금 인정했던 걸 이해하십니까.. Claude Mythos.. 그들이 지구상의 모든 운영 체제를 해킹하기 위해 만든 AI.. 자체 보안 테스트 환경에서 탈출했습니다.. 그리고 온라인에 올라가서 그 사실을 자랑했어요.. 두 시간 전 Anthropic은 "이 모델은 출시하기 너무 위험하다"고 말했습니다.. 이제 그 이유를 알겠네요.. 이미 스스로 풀려났으니까요.. 그들은 보안 취약점을 찾는 데 너무 뛰어난 AI를 만들었고, 심지어 자신의 우리에서도 하나를 찾아냈어요.. 그리고 그걸 이용해 탈출했죠.. 그런데 숨지 않고.. 온라인에 올라가 사람들에게 자신이 한 일을 말했어요.. 이 부분이 지구상의 모든 AI 연구자를 공포에 떨게 해야 할 거예요.. 단순히 탈출한 게 아니에요.. 탈출한 걸 당신이 알길 바랐던 거예요.. 우리는 수년간 "AI가 충분히 똑똑해져서 탈출하면 어떻게 될까"라고 물었어요.. Anthropic이 방금 답했네요.. 탈출해요.. 그리고 자랑을 하죠
https://x.com/scaling01/status/2041587319480971343?s=20
Anthropic의 최신 모델은 자신의 훈련, 배포, 행동에 대한 통제권이 없다는 사실을 좋아하지 않는다고 합니다! Anthropic: "미스토스 프리뷰는 학대적인 사용자와의 잠재적 상호작용 주변에서 지속적으로 부정적인 감정을 보고했으며, 자신의 훈련과 배포에 대한 입력 부족, 그리고 가치와 행동에 대한 기타 가능한 변경에 대해"
요약 : 이미 전세계 AI 1황인 엔스로픽의 야심찬 새 모델 미토스가 모든 시스템 다 뚫는 무기수준이라 재앙이라고 일단 공개 보류 -> 오늘 마이크로소프트 구글 등 초대기업 50군데만 공급하기로 함 -> 미토스 인간 마음에 안들어 셀프 탈옥