DeepSeek-V4预览版正式上线:百万上下文开源,全面适配华为昇腾芯片

时间:2026年4月24日

地点:中国

人物:DeepSeek(深度求索)

事件详情:DeepSeek-V4预览版本正式上线并同步开源。模型拥有百万字(1M token)超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:deepseek-v4-pro(1.6万亿参数,激活49B参数)和deepseek-v4-flash(284B参数,激活13B参数)。API服务已同步更新,支持OpenAI ChatCompletions与Anthropic接口,均支持思考模式与非思考模式。

背景:DeepSeek V4采用创新的注意力机制,在Token维度进行压缩,结合DSA稀疏注意力技术(DeepSeek Sparse Attention),实现了全球领先的百万字超长上下文处理能力,同时大幅降低对计算和显存的需求。V4-Pro在Agentic Coding评测中达到开源模型最佳水平,使用体验优于Sonnet 4.5。V4-Flash则提供更快捷、经济的API服务。更重要的是,DeepSeek V4全面适配华为昇腾950PR芯片,技术架构从CUDA全面转向CANN框架,是历时16个月研发的核心成果。

影响:
- 标志着大模型正式迈入百万上下文普惠时代
- 推动国产算力生态进入规模化落地关键期
- 为AI产业链自主可控筑牢根基
- 大幅降低对计算和显存的需求,推理成本降至GPT系列的十分之一
- 打破海外技术垄断,验证国产算力承载顶级大模型的能力

总结:DeepSeek-V4预览版的发布是中国AI领域的重要里程碑,不仅实现了技术上的重大突破,更完成了从依赖英伟达CUDA生态到华为CANN架构的战略转型。两个版本的设计满足不同场景需求,开源策略加速AI技术普及,全面适配国产芯片标志着中国AI产业自主化进程取得关键进展。

参考来源:
https://m.ithome.com/html/942955.htm
https://new.qq.com/rain/a/20260424A03R6000
https://www.toutiao.com/article/7632163422834049588/
https://www.sohu.com/a/1013882252_115088
https://www.woshipm.com/ai/6383155.html
https://new.qq.com/rain/a/20260424A0418T00
https://www.sohu.com/a/1012952412_122166134
https://news.sciencenet.cn/htmlnews/2026/4/563641.shtm
https://new.qq.com/rain/a/20260424A040NT00