메뉴 건너뛰기

이슈 AI에게 수능 수학문제를 풀게 시켰을 때 점수 순위
4,167 25
2025.12.17 08:36
4,167 25

mhFHhJ

 

https://n.news.naver.com/mnews/article/025/0003489988?sid=105

 

15일 김종락 서강대 수학과 교수 연구팀은 ‘국가대표 AI’ 도전 모델들의 성능 평가 결과를 공개했다. 평가 대상은 네이버, NC AI, LG AI연구원, SKT, 업스테이지 등 과학기술정보통신부(과기정통부)의 독자 AI 파운데이션 모델 프로젝트에 참여하고 있는 5개 국내 기업의 AI 모델과 오픈AI, 구글, 딥시크 등 해외 AI 기업의 최신 모델 5개다. 연구팀은 수능 수학의 네 분야(공통과목, 확률과 통계, 미적분, 기하)에서 가장 난도가 높은 문제 5개씩 20문제, 국내 논술·인도 대학 입시 10문제씩, 일본 도쿄대 공과대학 대학원 입시 10문제 등 총 50개 문제를 선별해, AI에 풀게 했다.

 

그 결과 5개 해외 AI모델은 전부 70% 이상 정답률을 기록했다. 특히 구글의 최신모델 ‘제미나이 3 프로’는 50문항 중 46문제를 맞춰 92% 정답률을 보였다. 앤스로픽의 클로드가 84%, xAI의 그록이 82% 정답률로 뒤를 이었다. 반면 국내 AI 기업의 모델들은 이들과 비교해 정답률이 확연히 떨어졌다. 업스테이지의 ‘솔라 프로 2’(58%)를 제외하고는 대부분 20%대 정답률을 보였다. 연구팀이 수학올림피아드, 대학 수학 개념을 재구성해 자체적으로 개발한 데이터셋인 ‘엔트로피 세트’ 문제에서도 해외 AI 모델들은 80점을 넘긴 반면, 국내 AI 모델은 7.1~53.3점을 기록했다. 김종락 교수 연구팀은 “국내 모델 수준이 해외 프론티어 모델에 비해 뒤처진다는 것을 알 수 있었다”고 평가했다. 

 

 

 

 

 

묵직한 엔씨의 존재감 ㄷㄷ

 

 

 

목록 스크랩 (0)
댓글 25
댓글 더 보기
새 댓글 확인하기

번호 카테고리 제목 날짜 조회
이벤트 공지 💗바비 브라운X더쿠💗 더 빛나는 글로우로 돌아온 레전드 립밤! NEW 엑스트라 립 틴티드 밤 체험 이벤트 1061 12.15 37,657
공지 [공지] 언금 공지 해제 24.12.06 4,325,781
공지 📢📢【매우중요】 비밀번호❗❗❗❗ 변경❗❗❗ 권장 (현재 팝업 알림중) 24.04.09 10,992,663
공지 공지가 길다면 한번씩 눌러서 읽어주시면 됩니다. 23.11.01 12,363,988
공지 ◤더쿠 이용 규칙◢ [스퀘어 정치글은 정치 카테고리에] 20.04.29 34,318,187
공지 정치 [스퀘어게시판 정치 카테고리 추가 및 정치 제외 기능 추가] 07.22 1,008,280
공지 정보 더쿠 모바일에서 유튜브 링크 올릴때 주의할 점 780 21.08.23 8,452,085
공지 정보 나는 더쿠에서 움짤을 한 번이라도 올려본 적이 있다 🙋‍♀️ 266 20.09.29 7,380,748
공지 팁/유용/추천 더쿠에 쉽게 동영상을 올려보자 ! 3589 20.05.17 8,577,110
공지 팁/유용/추천 슬기로운 더쿠생활 : 더쿠 이용팁 4012 20.04.30 8,468,681
공지 팁/유용/추천 ◤스퀘어 공지◢ [9. 스퀘어 저격판 사용 금지(무통보 차단임)] 1236 18.08.31 14,276,822
모든 공지 확인하기()
1632538 이슈 부산에 본사를 둔 한국자산관리공사, 즉 캠코가 30억 원 상당 국유지를 부산 용궁사에 수의계약으로 팔았다가 감사원에 적발됐습니다. 1 10:55 164
1632537 이슈 2015년과 2025년 세계부자 순위 1 10:55 115
1632536 이슈 수트도 잘 어울리는 아이브 리즈 1 10:55 109
1632535 이슈 프롬 맛집 장현승 8 10:53 488
1632534 이슈 눈빛이 반짝반짝 별 박은것 같은 최근 배우 하지원 10:52 287
1632533 이슈 박나래, ‘나래바’로 책 출판까지…“수위 조절 힘들었다” 18 10:51 1,828
1632532 이슈 [유퀴즈예고] 크리스마스 선물처럼 온 필릭스🎁, 〈냉부해〉 김풍, 3억 기부 치과의사, 판사 출신 작가 문유석까지 2 10:50 303
1632531 이슈 디즈니에서 아이를 안아주는 방식 4 10:49 615
1632530 이슈 롭 라이너 아들 편의점에서 음료수 마시는 거 cctv에 찍혀서 또 논란중 1 10:40 2,849
1632529 이슈 📢📢오늘부터 인천대교 통행료 인하📢📢 17 10:39 1,103
1632528 이슈 2026 밀라노-코르티나 동계올림픽 개막까지 D-50 2 10:38 339
1632527 이슈 현재 환율.jpg 13 10:34 3,015
1632526 이슈 ‘비혼 지나간 유행이고 요즘 다 결혼한다'의 현실 81 10:34 7,643
1632525 이슈 빌보드 2025 K팝 공연 수익 TOP 10 11 10:34 732
1632524 이슈 일본에서 CJ랑 합작해서 이번에 내는 케이팝 일본드라마 53 10:28 3,026
1632523 이슈 중성화 수술해서 기분이 안 좋은 강아지 8 10:27 1,611
1632522 이슈 오스카 시상식이 2029년부터 지상파 방송을 떠나 유튜브에서 독점 스트리밍 됩니다. 3 10:17 523
1632521 이슈 [KBO] 삼성 라이온즈, FA 투수 이승현과 2년 최대총액 6억원에 계약 8 10:16 803
1632520 이슈 [KBO] 삼성 라이온즈, FA 투수 김태훈과 3+1년 최대 20억원 계약 / FA 투수 이승현과 2년 최대 6억 계약 5 10:14 726
1632519 이슈 본인생일에 하이디라오에서 신년회하는 블랙핑크 지수 7 10:14 1,594