둘다 MLLM (멀티모달, 이미지/동영상 인식 가능한) 모델
https://x.com/Alibaba_Qwen/status/1883954247743725963

알리바바 클라우드의 Qwen2.5-VL 모델
각종 벤치마크에서 Gemini-2 Flash, GPT-4o, Claude3.5 Sonnet 등 현존 최고 성능의 멀티모달 AI들보다 우세함


요즘 핫한 DeepSeek 팀에서 공개한 DeepSeek Janus-Pro 모델
소형 모델인데, 이미지 생성 기능이 뛰어남
재밌는점은 멀티모달 기능이 없는 DeepSeek 모델을 갖다가 기존 모델에 붙여서 만들었는데 성능이 확 올랐다는 점
두개 다 오픈 모델이고 모델이 공개되어 있어서 고사양 컴퓨터만 있다면 직접 돌리기 가능함
ChatGPT, Gemini, Sonnet 등은 폐쇄형(Closed) 모델