https://qwenlm.github.io/blog/qwen2.5-max/
DeepSeek-V3와 유사한 MoE 모델
DeepSeek-V3보다 성능 잘나오고 일부 벤치마크에서 GPT-4o, Claude3.5-Sonnet보다 우세
https://qwenlm.github.io/blog/qwen2.5-max/
DeepSeek-V3와 유사한 MoE 모델
DeepSeek-V3보다 성능 잘나오고 일부 벤치마크에서 GPT-4o, Claude3.5-Sonnet보다 우세
면차르트ㅠ