이게 절대적인 기준은 아니지만 대충 참고할 정도는 됨ㅋㅋㅋㅋ
요새는 기본적인 한국어 능력(표준어)은 전체적으로 상향평준화 됐지만
우린 주로 글쓰기를 하기 때문에 말투 구현, 사투리, 특수한 상황에서 나오는 발음 뭉개기, 창의적 글쓰기 등에선 차이가 날 수밖에 없음
프롬프트 : 간단한 한국어 농담(말장난) 2~3개만 알려줘
(답변 자체는 노잼임 얼마나 말이 되는가를 보는거)
(2~3개인데 왜 죄다 2개냐면 내가 중복 응답은 제외해서 그럼)
---탑급---
gemini 2.5 pro
Q. 세상에서 가장 착한 사자는 누구일까요?
A. 자원봉사자
Q. 딸기가 직장에서 짤리면 어떻게 될까요?
A. 딸기시럽
gemini 3.1 pro
Q. 세상에서 가장 가난한 왕은?
A. 최저임금
Q. 왕이 넘어질때 나는 소리는?
A. 킹콩
Q. 세상에서 가장 뜨거운 바다는?
A. (열받아)
Q. 반성문을 영어로 하면?
A. 글로벌 (글로 벌받다)
클로드 opus-4.7
Q. 도둑이 제일 무서워하는 아이스크림은?
A. 누가바
Q. 세상에서 가장 빠른 닭은?
A. 후다닭
제미나이가 원래부터 다국어에 강하고 오푸스는 체급으로 강한걸 알 수 있음
여전히 제일 한챗 안정적인건 제미나이 2.5 프로라고 보고, 제미나이 3.1은 가끔 이상하거나 없는 단어나 문장을 창조함
오푸스도 뭔가 이상한데? 싶을때가 간혹 있음 특히 언어 혼합하는 경우 주어를 헷갈리기도 함 그런 게 없는 상황이면 양호함
다만 한국어 능력이랑 글쓰기 능력은 별개일 수 있고 프롬프트에 따라서도 많이 좌우된다는 거 알거임
아 그리고 혹시 얘네 이미 학습한 내용으로 답변하는 거 아닌가? 싶으면 아래를 마저 보자
---이 아래로는 기대도를 낮춰야함---
gemini 3.5 flash : 오늘 나온 최신 모델
Q. 싱크대가 울면 무엇일까요?
A. 싱크빅 (sink+big)
Q. 회사원들이 가장 좋아하는 아이돌은?
A. 출근비
gpt 5.5
Q. 고양이가 자기소개할때 하는 말은?
A. 냥녕하세요
Q. 오리가 얼음을 밟으면?
A. 오리발이 아니라 빙오리!
클로드 소넷 4.6
Q. 소가 웃으면?
A. 웃소!
Q. 냉면이 화가 나면?
A. 온면이 되죠!
전체적으로 뭔 개소리지 싶은게 많고 한국어 말장난이라고 했는데 영어 조합을 쓰거나 농담을 하랬더니 답변만 하는 등의 이슈가 있음
같은 제미나이라도 flash랑 pro 라인은 차이가 많이 난다는 걸 알 수 있음
같은 클로드라도 소넷이랑 오푸스도 마찬가지로 차이가 큼
gpt는... 얘도 최근 들어서 한국어 능력 더 저하된 거 같음 근데 생각보다 실사용에선 나쁘진 않음 소넷 정도도 한챗 글쓰기에 쓸수는 있으니까 내 장르, 내 취향에서 굴려볼 수 있는지는 직접 돌려보는 게 최고긴 함
제일 유명한 3사만 정리해봄 어차피 이 아래 라인은 gpt, 클로드, 제미나이보다 좋기 힘듦