时间:2026年5月23日
地点:中国上海
人物:面壁智能、清华大学、OpenBMB开源社区、华为昇腾
事件详情:面壁智能联合清华大学、OpenBMB开源社区正式发布新端侧模型BitCPM-CANN,这是中国首个完全基于国产算力平台训练并开源的三值(1.58-bit)大模型。模型从量化算子、训练算法到全链路框架,均在华为昇腾AI处理器上完成,开源版本涵盖5亿至80亿参数。
背景:今年以来,大模型产业面临内存危机,被迫在模型能力和内存预算间取舍。此前低比特大模型核心技术几乎全部来自国外,国内缺乏系统性工程验证和自主可控训练底座。面壁智能提出密度定律并推动轻量化大模型全球开源,与华为深度合作已久。
影响:
- 推理侧可释放约6倍实际显存容量,有望将60比特大模型装入手机
- 为华为昇腾AI芯片在手机、PC、汽车、IoT等场景提供杀手级应用
- 开辟不依赖国外高端芯片的端侧智能新路径
总结:BitCPM-CANN在国产算力平台上实现1.58比特极低位宽下接近全精度的能力保留,标志着中国在算力自主和模型高效双轮驱动上取得重大突破。面壁智能承诺全面开源,降低全行业对国外AI软硬件依赖,构建中国自己的低位宽大模型生态高地。
参考来源:
http://finance.sina.com.cn/jjxw/2026-05-24/doc-inhyyaqq6873924.shtml
https://www.cnfin.com/gs-lb/detail/20260524/4416644_1.html








