
https://www.aitimes.com/news/articleView.html?idxno=169779
'딥시크-R1'이 생성한 텍스트 4분의 3이 오픈AI '챗GPT' 출력과 일치하는 것으로 알려졌다.
이는 딥시크가 오픈AI의 모델을 증류(distillation)했다는 유력한 증거로 꼽히게 됐다.
연구진은 '클로드'와 '제미나이', '라마', '챗GPT' 등을 학습한 분류기 3대를 활용,
모두가 동의할 때만 표절로 인정하는 만장일치 배심원 시스템을 도입했다.
이를 통해 99.88%의 높은 정확도로 AI 모델의 텍스트를 정확하게 식별했다고 강조했다.
결합, 문장 구조나 어휘, 표현과 같은 미묘한 문체적 특징을 식별한 결과를 발표 결과,
딥시크의 생성된 텍스트의 74.2%가 챗GPT와 일치한다는 것을 발견했다.
*마소의 '파이-4'는 0.7%의 일치율.
xAI의 '그록'은 챗GPT 일치율이 0%*
인공지능(AI) 거버넌스 및 표절 감지 전문 카피리크스는
기술적 문제 외에도 딥시크가 오픈AI의 무단 추출에 기반해
저비용의 혁신을 만들었다고 주장하는 것은 시장을 오도해
엔비디아에 손실을 입히고 부당한 이점을 챙겼을 가능성이 있다고 비판했다.