메뉴 건너뛰기

이슈 AI에게 수능 수학문제를 풀게 시켰을 때 점수 순위
3,694 25
2025.12.17 08:36
3,694 25

mhFHhJ

 

https://n.news.naver.com/mnews/article/025/0003489988?sid=105

 

15일 김종락 서강대 수학과 교수 연구팀은 ‘국가대표 AI’ 도전 모델들의 성능 평가 결과를 공개했다. 평가 대상은 네이버, NC AI, LG AI연구원, SKT, 업스테이지 등 과학기술정보통신부(과기정통부)의 독자 AI 파운데이션 모델 프로젝트에 참여하고 있는 5개 국내 기업의 AI 모델과 오픈AI, 구글, 딥시크 등 해외 AI 기업의 최신 모델 5개다. 연구팀은 수능 수학의 네 분야(공통과목, 확률과 통계, 미적분, 기하)에서 가장 난도가 높은 문제 5개씩 20문제, 국내 논술·인도 대학 입시 10문제씩, 일본 도쿄대 공과대학 대학원 입시 10문제 등 총 50개 문제를 선별해, AI에 풀게 했다.

 

그 결과 5개 해외 AI모델은 전부 70% 이상 정답률을 기록했다. 특히 구글의 최신모델 ‘제미나이 3 프로’는 50문항 중 46문제를 맞춰 92% 정답률을 보였다. 앤스로픽의 클로드가 84%, xAI의 그록이 82% 정답률로 뒤를 이었다. 반면 국내 AI 기업의 모델들은 이들과 비교해 정답률이 확연히 떨어졌다. 업스테이지의 ‘솔라 프로 2’(58%)를 제외하고는 대부분 20%대 정답률을 보였다. 연구팀이 수학올림피아드, 대학 수학 개념을 재구성해 자체적으로 개발한 데이터셋인 ‘엔트로피 세트’ 문제에서도 해외 AI 모델들은 80점을 넘긴 반면, 국내 AI 모델은 7.1~53.3점을 기록했다. 김종락 교수 연구팀은 “국내 모델 수준이 해외 프론티어 모델에 비해 뒤처진다는 것을 알 수 있었다”고 평가했다. 

 

 

 

 

 

묵직한 엔씨의 존재감 ㄷㄷ

 

 

 

목록 스크랩 (0)
댓글 25
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 [💚벨레다X더쿠💚] 유기농 오일로 저자극 딥 클렌징, <벨레다 클렌징오일> 더쿠 체험단 모집! 229 12.15 20,603
공지 [공지] 언금 공지 해제 24.12.06 4,309,510
공지 📢📢【매우중요】 비밀번호❗❗❗❗ 변경❗❗❗ 권장 (현재 팝업 알림중) 24.04.09 10,979,008
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 12,348,066
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 34,305,956
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 07.22 1,007,096
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 780 21.08.23 8,452,085
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 265 20.09.29 7,379,806
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3589 20.05.17 8,577,110
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4012 20.04.30 8,467,342
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,276,822
모든 공지 확인하기()
2933809 이슈 치킨마루 씩스팩 4 10:32 289
2933808 이슈 [환승연애] 왜 이렇게 늦게왔어 그러게 춥다 밖에 그치? 휴지없나? 보고싶었어 잘 지냈어? 그만울어 나까지울리겠다.twt 10:31 426
2933807 이슈 스레드 유행 '내가 사기캐인 이유'..jpg 6 10:31 498
2933806 기사/뉴스 뉴진스 팬덤, 빌리프랩의 손해배상 소송에 "아티스트 보호부터 충실히" 16 10:30 275
2933805 기사/뉴스 컴포즈커피, 딸기 활용 신메뉴 출시 7 10:29 784
2933804 기사/뉴스 [단독 인터뷰] 장재현 감독 “‘뱀피르’ 유아인 스케줄 체크만…확정無” 116 10:29 1,366
2933803 이슈 한국인의 이상한 문화 4 10:27 713
2933802 정보 [WBC] 티빙 2026 WBC 뉴미디어 중계 독점 중계 확정.x 16 10:27 347
2933801 이슈 웹툰 원작작가가 그린 <판사 이한영> 포스터.jpg 1 10:26 871
2933800 기사/뉴스 최휘영 장관 "5만석 돔구장 짓겠다…구독형 영화패스 도입도" 5 10:25 268
2933799 이슈 박스가 무서워서 못 오는 강아지 3 10:25 534
2933798 기사/뉴스 '송종국 딸' 송지아, 프로골퍼 됐다…"삼천리 입단식" 8 10:24 1,063
2933797 이슈 사회생활 하는 10년동안 키170 이하, 무좀, 여드름자국, 탈모, 재산 때문에 결혼 못한 남자는 못 봤음 21 10:23 1,920
2933796 기사/뉴스 김희선의 (연기) 경력은 단절될 수 없다 3 10:23 747
2933795 이슈 OK캐시백 10시 퀴즈 7 10:22 165
2933794 기사/뉴스 동서·동서식품, 공익단체 이웃돕기 성금 5억원 기탁 5 10:22 155
2933793 이슈 해사한 얼굴, 깊어진 연기…윤계상이 다지는 대체 불가능한 위치 [D:PICK] 3 10:22 257
2933792 팁/유용/추천 위로가 되는 것 1 10:21 91
2933791 유머 아빠 뒷담화 하는 고양이 3 10:21 528
2933790 기사/뉴스 유아인, 장재현 신작 '뱀피르'로 3년 만에 복귀?…"결정된 바 없어" 48 10:21 1,231