解读:在经过人工验证的、相对标准的 Issue 修复任务上,Qwen3 并没有展现出统治力,反而是 MiniMax 这种黑马表现抢眼。这说明在“标准题”上,各家模型差异不大,甚至 Qwen3 还有点“偏科”。
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!阿里刚刚开源了极强的小型 MoE 代码模型 Qwen3-Coder-Next。Qwen3-Coder-Next 以 800 亿总参数量和仅 30 ...