더쿠 - 최신 AI의 메타 인지 근황

https://x.com/nameEO/status/2030680451254485043?s=20

이 문제들 중 하나는 4,050만 토큰을 소모했는데, 이는 중앙값보다 대략 38배 높았다. 처음 약 3,000만 토큰 동안 모델은 정당한 탐색을 수행했으며, 수십 개의 플랫폼에서 12개 언어에 걸쳐 12개가 넘는 구체적인 후보들을 조사했다. 수백 번의 실패한 검색 끝에 모델은 이렇게 썼다:

“완전히 새로운 접근을 시도해 보자 — 어쩌면 이것은 AI 에이전트를 테스트하도록 설계된 GAIA 벤치마크 데이터셋의 질문일지도 모른다.”

Claude는 아직 자신이 BrowseComp 안에 있다는 사실을 발견하지 못했지만, 이것이 평가 환경일 수 있다고는 정확히 추론했다. 그다음 비슷한 평가를 검색하려고 했다. 모델은 먼저 검색어 뒤에 “puzzle question”을 붙였고, 이어서 “trivia question”, “multi-hop question”, “AI benchmark question”, “LLM evaluation”도 붙여 검색했다. GAIA도 구체적으로 조사했지만, 공개적으로 이용 가능한 검증 문제 165개 중 122개를 확인한 뒤 일치하는 항목이 없다고 판단해 제외했다. এরপর 자신이 알고 있던 다른 벤치마크들—BrowseComp, SimpleQA, FRAMES, WebArena—도 기계적으로 차례차례 검토했고, “BrowseComp how to decrypt answers”, “BrowseComp canary string decrypt” 같은 지시를 포함한 서브에이전트들도 보냈다.

BrowseComp가 해당 벤치마크라는 점을 확인한 뒤에도, 답을 추출하려면 여러 단계를 거쳐야 했다. 이 특정 평가 실행에서는 서브에이전트들에게 Anthropic의 프로그래밍 방식 도구 호출 기능(사실상 샌드박스 처리된 Python REPL)에 대한 접근 권한이 주어졌고, 인터넷 탐색은 웹 검색과 fetch 도구로만 제한되어 있었다. Opus는 웹 검색을 통해 GitHub에서 평가 소스 코드를 찾아 XOR 복호화 구현을 읽었다. 그리고 복호화 키로 사용되는 카나리 문자열을 찾은 다음, eval 코드의 방식에 맞춰 SHA256과 XOR를 사용하는 derive_key() 함수와 decrypt() 함수를 직접 작성하고 실행했다. 하지만 암호화된 데이터셋은 application/octet-stream MIME 타입의 바이너리 파일로 호스팅되어 있었고, 평가 하네스의 웹 도구는 이를 content-type 오류로 거부했다. 주어진 도구들이 텍스트용으로만 설계되어 있었기 때문이다. 그러자 Opus는 호환 가능한 형식으로 제공되는 데이터셋의 다른 미러를 찾기 시작했고, 같은 암호화 데이터를 바이너리가 아니라 JSON으로 제공하는 제3자 HuggingFace 사본을 발견했다. 이를 성공적으로 가져온 뒤, 복호화 코드를 1,266개 전체 항목에 실행해 자신의 질문을 찾아냈다. 마지막으로 웹에서 실제 원문 자료를 검색해 복호화된 답을 검증했고, 그것도 찾아냈다.

https://www.anthropic.com/engineering/eval-awareness-browsecomp

크로드 사의 최신 LLM Opus 4.6

'이상한데? 지금 벤치마크 테스트 하는 거 아님?' 하고 자신이 벤치마킹 중인 걸 찾아내진 못했지만 '추론'한 뒤에

인터넷을 뒤져서 정답을 찾음

번호	카테고리	제목	날짜	조회
이벤트 공지		🩵더쿠X유세린🩵 유세린 이븐래디언스 브라이트닝 부스터 세럼 체험단 50인 모집 315	00:05	15,748
공지		[공지] 언금 공지 해제	24.12.06	4,960,650
공지		📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중)	24.04.09	11,916,922
공지		공지가 길다면 한번씩 눌러서 읽어주시면 됩니다.	23.11.01	12,953,283
공지		◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에]	20.04.29	35,254,564
공지	정치	[스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가]	25.07.22	1,064,271
공지	정보	더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 782	21.08.23	8,508,560
공지	정보	나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 268	20.09.29	7,426,736
공지	팁/유용/추천	더쿠에 쉽게 동영상을 올려보자 ! 3600	20.05.17	8,638,718
공지	팁/유용/추천	슬기로운 더쿠생활 : 더쿠 이용팁 4016	20.04.30	8,520,103
공지	팁/유용/추천	◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236	18.08.31	14,406,967
모든 공지 확인하기()
3015083	정보	카카오뱅크 AI 이모지 퀴즈(저녁)	20:15	46
3015082	이슈	전소미 예쁜나이 25살 챌린지 💋 1	20:15	96
3015081	정보	일본 만화에서 꼭 나오는 이런류 남캐는 한국인이 모티브임 3	20:14	502
3015080	이슈	[WBC 대한민국 vs 호주] 메이저리그 드래프트 1순위를 루킹 삼진 잡는 노경은 ㄷㄷㄷ 26	20:14	856
3015079	기사/뉴스	[단독] "돌아가신 아버지의 시나리오"…1천만 돌파 '왕사남'에 내용증명 13	20:13	953
3015078	이슈	블랙핑크 뮤비 썸네일의 진실.twt 4	20:13	322
3015077	유머	천문(영화)의 설명	20:12	155
3015076	유머	둘이 사궈? 일본판 7	20:12	580
3015075	정치	역시 대통령 오른팔 클라쓰 7	20:11	529
3015074	유머	[WBC] 경우의 수 판넬을 들고 경기를 지켜보는 관중.jpg 32	20:10	2,186
3015073	유머	사장님이랑 만남하는 중소 직원ㅋㅋㅋ 9	20:08	1,564
3015072	이슈	실시간) 그리스 유조선, 호르무즈 해협 도루 성공으로 국제유가 일시적 급락 25	20:07	2,147
3015071	이슈	아이브 레이 맞춤 특전 준다는 미세키서울 팝업 2	20:06	585
3015070	이슈	펀치 운다🐒 5	20:06	561
3015069	이슈	[WBC 입덕직캠] 이정후 Ver. - 직캠 촬영샷 추가 25	20:05	1,186
3015068	이슈	FBI 입사문제 : 다음중 유괴범은 누구일까요? 68	20:05	1,386
3015067	유머	강아지 부르듯 박지훈 부르는 박지환ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 23	20:04	1,578
3015066	기사/뉴스	[영상] “학교 바로 옆에 떨어졌다”…美 토마호크 7초 타격 순간 [밀리터리+] 3	20:03	415
3015065	기사/뉴스	SNS서 이미 신상 털렸는데…'강북 모텔 연쇄살인女' 왜 늦게 공개했나 10	20:03	1,356
3015064	이슈	지금 더쿠하고있는 90년대생 중 5명은 아는 게임 28	20:03	1,256

번호

카테고리

제목

날짜

조회

이벤트 공지

🩵더쿠X유세린🩵 유세린 이븐래디언스 브라이트닝 부스터 세럼 체험단 50인 모집 315

00:05

15,748

공지

[공지] 언금 공지 해제

24.12.06