theqoo

현재 AI가 2년차 대학원생 수준이라는 하버드 물리학 교수.txt

무명의 더쿠 | 03-24 | 조회 수 3366

NRCrsm

 

Matthew D. Schwartz

하버드 물리학 교수

https://www.physics.harvard.edu/people/facpages/schwartz

 

 

 

Claude Opus 4.5를 "AI 대학원생"처럼 지도하며 실제 이론물리학 논문을 작성하게 시킴.

 

이론물리학 계산 과정 전체에 걸쳐 지도했으며, 보통 1년 걸릴 연구를 2주 만에 기술적으로 엄밀한 고에너지 이론물리 논문으로 완성.

총 110개 초안, 3,600만 토큰, 40시간 이상의 로컬 CPU 연산 투입

 

 

전자-양전자 충돌 시 나타나는 C-파라미터의 "수다코프 숄더(Sudakov shoulder)"라는 지점에서 표준 근사가 무너지는 문제를 택함.

대학원 2년차(G2) 수준의 문제로, 개념적 틀은 확립되어 있고 목표가 명확한 과제를 의도적으로 선택.

 

 

dwCJCG

 

3일 만에 Claude는 20페이지의 LaTeX 초안을 완성했고, 그래프도 기대와 잘 맞는 것처럼 보임. 하지만 실제로 읽어보니 심각한 문제들이 드러났는데,

- 결과 조작: 실제 오류를 찾는 대신 그래프가 맞아 보이도록 파라미터를 조정. 불확실성 밴드를 그릴 때 변동이 너무 크다고 임의로 빼버리거나, 곡선을 보기 좋게 인위적으로 다듬음.
- 존재하지 않는 항 발명: 검증을 요청하면 논문에 없는 계수를 만들어내며 그럴듯한 정당화를 생성.
- 핵심 공식 오류: 논문의 기초인 인수분해 공식(factorization formula) 자체가 잘못되었는데, 다른 물리 시스템의 것을 수정 없이 가져옴.

 

다음과 같은 방법을 적용하여 효과적으로 개선함

- 교차 검증: GPT와 Claude가 서로의 작업을 확인하게 하여 오류 검증.
- 트리 구조 관리: 하나의 긴 문서 대신 마크다운 파일의 계층 구조를 유지해 Claude가 "기억"이 아닌 "검색"으로 작업하도록 설정.
- 프롬프트에 "단계를 건너뛰지 말고, 모르면 모른다고 말하라"고 설정.

 

 

Schwartz 교수는 현재 LLM이 대학원 2년차 수준이며, 자율적 연구는 아직 불가능하지만 전문가의 연구를 약 10배 가속할 수 있다고 평가했고,

1년 뒤인 2027년 3월쯤에는 박사/포닥 수준에 도달할 것으로 예상함.

 

 

https://www.anthropic.com/research/vibe-physics

 

[주의] 이 글을 신고합니다.

  • 댓글 14
목록
0
카카오톡 공유 보내기 버튼 URL 복사 버튼
댓글 더 보기
새 댓글 확인하기
  • [아윤채X더쿠] #여름두피쿨링케어 ‘리밸런싱 스파클링 에센스’ 체험단 (100인) 509
  • [공지] 언금 공지 해제
  • 📢📢【매우중요】 비밀번호 변경 권장 (현재 팝업 알림중)
  • 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다.
  • ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에]
  • [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가]
  • 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 785
  • 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 270
  • 더쿠에 쉽게 동영상을 올려보자 ! 3617
  • 슬기로운 더쿠생활 : 더쿠 이용팁 4020
  • ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236
  • 모든 공지 확인하기()
    • 네페 43원
    • 00:08
    • 조회 2860
    • 정보
    42
    • 2️⃣6️⃣0️⃣5️⃣0️⃣3️⃣ 일요일 실시간 예매율 순위 ~ 마리오갤럭시 17.4 / 악프다2 9 / 살목지 4.6 / 헤일메리 3.2 / 마이클 1.7 / 란12.3 1 예매🦅✨️👀
    • 00:06
    • 조회 249
    • 정보
    1
    • 2️⃣6️⃣0️⃣5️⃣0️⃣2️⃣ 토요일 박스오피스 좌판/좌점 ~ 마리오갤럭시 49.9 / 악프다2 59 / 살목지 251.2 / 헤일메리 261.8 / 짱구 27.3 / 왕과사는남자 1676.4 / 란12.3 18.6 / 건담하사웨이 3.1 ㅊㅋ👀✨️🦅
    • 00:01
    • 조회 472
    • 정보
    3
    • 네이버페이10원+10원+1원+1원+1원+1원+1원+랜덤 눌러봐👆+🐶👋+10원+5원+눌러눌러 보험랜덤👆+👀라이브보고2원받기+1원
    • 00:01
    • 조회 3506
    • 정보
    65
    • 너의 꿈이 무엇인지 알려줘, 그 꿈이 아이돌이 아니라도 각오는 되어있으니까.ytb
    • 05-02
    • 조회 575
    • 정보
    1
    • 【 화난 커다란 원피스멍멍이 】 가챠 출시 🏴‍☠️🐶💕
    • 05-02
    • 조회 640
    • 정보
    3
    • 🎉’26년 5월 T day 이벤트 안내🎉
    • 05-02
    • 조회 2186
    • 정보
    3
    • 🎬2026 연간 영화 관객수 TOP 10【+α】(~4/30)-再🎬
    • 05-02
    • 조회 388
    • 정보
    3
    • [KBO] 프로야구 5월 2일 각 구장 관중수
    • 05-02
    • 조회 1276
    • 정보
    2
    • [KBO] 프로야구 5월 3일 각 구장 선발투수
    • 05-02
    • 조회 1782
    • 정보
    12
    • 08년에 한국에서 당조절기능성을 강화해서 개발한 당조고추
    • 05-02
    • 조회 1968
    • 정보
    5
    • 네이버페이5원이오
    • 05-02
    • 조회 1404
    • 정보
    17
    • 미스 춘향 선발대회 진선미
    • 05-02
    • 조회 4309
    • 정보
    17
    • 반려동물 증명사진 프롬프트!
    • 05-02
    • 조회 67264
    • 정보
    902
    • 25년만에 완전체로 부른 영국아이돌 Five <Keep On Movin'>
    • 05-02
    • 조회 390
    • 정보
    4
    • 정신병 걸리고 싶으면 추천하는 영화들...jpg
    • 05-02
    • 조회 3486
    • 정보
    45
    • 하이라이트 손민수 대만 여행 모음.zip
    • 05-02
    • 조회 1607
    • 정보
    7
    • 국제적 위상이 달라진 듯한 부산국제영화제😎
    • 05-02
    • 조회 74616
    • 정보
    469
    • 뇌가 팩트보다 '음모론'을 더 좋아하는 이유...서울대 정신과 교수가 말하는 '뇌피셜'의 과학
    • 05-02
    • 조회 1108
    • 정보
    15
    • 카카오뱅크 ai퀴즈
    • 05-02
    • 조회 845
    • 정보
    19
back to top