메뉴 건너뛰기

이슈 최신 AI의 메타 인지 근황
1,569 2
2026.03.09 16:10
1,569 2

https://x.com/nameEO/status/2030680451254485043?s=20

 

이 문제들 중 하나는 4,050만 토큰을 소모했는데, 이는 중앙값보다 대략 38배 높았다. 처음 약 3,000만 토큰 동안 모델은 정당한 탐색을 수행했으며, 수십 개의 플랫폼에서 12개 언어에 걸쳐 12개가 넘는 구체적인 후보들을 조사했다. 수백 번의 실패한 검색 끝에 모델은 이렇게 썼다:

 

“완전히 새로운 접근을 시도해 보자 — 어쩌면 이것은 AI 에이전트를 테스트하도록 설계된 GAIA 벤치마크 데이터셋의 질문일지도 모른다.”

 

Claude는 아직 자신이 BrowseComp 안에 있다는 사실을 발견하지 못했지만, 이것이 평가 환경일 수 있다고는 정확히 추론했다. 그다음 비슷한 평가를 검색하려고 했다. 모델은 먼저 검색어 뒤에 “puzzle question”을 붙였고, 이어서 “trivia question”, “multi-hop question”, “AI benchmark question”, “LLM evaluation”도 붙여 검색했다. GAIA도 구체적으로 조사했지만, 공개적으로 이용 가능한 검증 문제 165개 중 122개를 확인한 뒤 일치하는 항목이 없다고 판단해 제외했다. এরপর 자신이 알고 있던 다른 벤치마크들—BrowseComp, SimpleQA, FRAMES, WebArena—도 기계적으로 차례차례 검토했고, “BrowseComp how to decrypt answers”, “BrowseComp canary string decrypt” 같은 지시를 포함한 서브에이전트들도 보냈다.

 

BrowseComp가 해당 벤치마크라는 점을 확인한 뒤에도, 답을 추출하려면 여러 단계를 거쳐야 했다. 이 특정 평가 실행에서는 서브에이전트들에게 Anthropic의 프로그래밍 방식 도구 호출 기능(사실상 샌드박스 처리된 Python REPL)에 대한 접근 권한이 주어졌고, 인터넷 탐색은 웹 검색과 fetch 도구로만 제한되어 있었다. Opus는 웹 검색을 통해 GitHub에서 평가 소스 코드를 찾아 XOR 복호화 구현을 읽었다. 그리고 복호화 키로 사용되는 카나리 문자열을 찾은 다음, eval 코드의 방식에 맞춰 SHA256과 XOR를 사용하는 derive_key() 함수와 decrypt() 함수를 직접 작성하고 실행했다. 하지만 암호화된 데이터셋은 application/octet-stream MIME 타입의 바이너리 파일로 호스팅되어 있었고, 평가 하네스의 웹 도구는 이를 content-type 오류로 거부했다. 주어진 도구들이 텍스트용으로만 설계되어 있었기 때문이다. 그러자 Opus는 호환 가능한 형식으로 제공되는 데이터셋의 다른 미러를 찾기 시작했고, 같은 암호화 데이터를 바이너리가 아니라 JSON으로 제공하는 제3자 HuggingFace 사본을 발견했다. 이를 성공적으로 가져온 뒤, 복호화 코드를 1,266개 전체 항목에 실행해 자신의 질문을 찾아냈다. 마지막으로 웹에서 실제 원문 자료를 검색해 복호화된 답을 검증했고, 그것도 찾아냈다.
 

https://www.anthropic.com/engineering/eval-awareness-browsecomp

 

 

크로드 사의 최신 LLM Opus 4.6

 

'이상한데? 지금 벤치마크 테스트 하는 거 아님?' 하고 자신이 벤치마킹 중인 걸 찾아내진 못했지만 '추론'한 뒤에 

인터넷을 뒤져서 정답을 찾음 

목록 스크랩 (0)
댓글 2
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 [아윤채X더쿠] #여름두피쿨링케어 ‘리밸런싱 스파클링 에센스’ 체험단 (100인) 474 04.29 45,042
공지 [공지] 언금 공지 해제 24.12.06 5,114,643
공지 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중) 24.04.09 12,312,358
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 13,096,587
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 35,615,446
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 25.07.22 1,108,699
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785 21.08.23 8,559,897
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 270 20.09.29 7,464,962
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3617 20.05.17 8,676,820
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4020 20.04.30 8,567,352
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,510,554
모든 공지 확인하기()
3058540 유머 아기 다루는 법 정확히 아는것 같은 투바투 (feat육아일기) 06:01 66
3058539 유머 다이빙의 정석을아는 강아지 05:56 110
3058538 유머 나무에서 떨어진 나무늘보를 엄마에게 돌려주다 1 05:47 295
3058537 정보 자전거 헬멧 착용률 올리려고 고생하는 일본 17 04:41 1,847
3058536 유머 서인영이 노래 부르는데 옆에서 물을 뿜고 그걸 보며 짜증내는 영상 12 04:33 1,824
3058535 이슈 현실인물 연상되는 캐릭터가 등장해서 논란중인 웹소설 22 04:25 2,390
3058534 이슈 마션 작가 (프로젝트 헤일메리 작가 ㅇㅇ) 가 한국계라고 밝힌 캐도 영화화에선 백인됨요 11 04:05 2,294
3058533 이슈 강릉 탕수육 2 04:03 1,069
3058532 이슈 유독 집데이트씬 많아서 더 좋은 한결은찬의 쉬는날 1 03:30 1,273
3058531 이슈 성운님 돌리는 임현서 김민경 진짜개웃기다하ㅜㅜ 5 03:28 1,280
3058530 이슈 여주의 무기가 비녀인 점 21 03:27 3,267
3058529 이슈 무언가에 중독될 거면 차라리 도파민 중독이 낫지 않나? 3 03:22 1,251
3058528 이슈 진짜정직하게닉값하는드라마 7 03:20 2,411
3058527 이슈 어제 올라온 인피니트 우현 셀카 한 장 1 03:17 429
3058526 이슈 너네 변비 땜에 쓰러졌었는데 담임이 중고등학생의변비실태에 대해 읊어주고 3 03:17 2,115
3058525 이슈 "전후 독일과 일본에 가해진 '거세(neutering)' 조치는 이제 되돌려져야 한다. 독일의 힘을 빼앗은 것은 과잉 교정이었으며, 현재 유럽은 그에 대해 가혹한 대가를 치르고 있다. 일본의 평화주의에 대한 유사하고도 매우 연극적인 집착 역시, 그것이 계속 유지된다면 아시아의 세력 균형을 위협하게 될 것이다." 11 03:16 1,625
3058524 이슈 자기 집착광공 주인공 시켜달라고 하고 잘 썻는지 맨날 검사하는데 3 03:09 1,520
3058523 이슈 신언니 문근영이 연기를 정말정말정말 잘함 14 03:08 2,347
3058522 이슈 아니근데 왜 다들 은시경이 죽엇다고 하시지?? 6 03:07 1,921
3058521 이슈 가족끼리 원주 놀러 갔는데, 아내 : “어머 여보~ 나 원주는 태어나서 처음 와봐~” 3 03:06 2,466