DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的 ...