기존 '챗GPT'에서도 텍스트를 음성으로 변환하는 기능을 제공했지만, GPT-4o는 이를 더욱 강화해 사용자의 말에 즉각적으로 반응하며 마치 실제 사람과 실시간으로 대화할 수 있게 됐다.
오픈AI 측은 GPT-4o가 최소 232밀리초(1000분의 1초), 평균 320밀리초 만에 오디오 입력에 응답할 수 있으며, 이는 사람과 사람 간의 커뮤니케이션 속도와 비슷한 수준이라고 설명했다.
https://youtu.be/vgYi3Wr7v_g?feature=shared
짧은 소개 영상
https://youtu.be/WzUnEfiIqP4?feature=shared
실시간 통역도 놀라운 수준..
이날 데모에서 GPT-4o는 사용자의 목소리에 담긴 감정이나 숨소리를 인식해 반응하는 모습을 선보였으며, 자신도 다양한 감정을 담아 여러 톤으로 대답을 생성하는 모습을 보여줬다. 또 GPT-4o는 50개 언어에 대한 향상된 성능을 갖췄으며, 이를 통해 다른 언어 간의 실시간 통역도 가능했다.
오픈AI는 GPT-4o를 무료로 공개할 예정이라고 밝혔다. 다만 유료 사용자에게는 5배 많은 사용량을 제공한다.
https://www.techm.kr/news/articleView.html?idxno=124595