开运体育世界杯中国官网首页将 600 亿参数大模子装进手机的瓶颈，终于被中国 AI 公司冲破了

开运世界杯技术统计

你的位置：开运体育世界杯中国官网首页 > 开运世界杯技术统计 > 开运体育世界杯中国官网首页将 600 亿参数大模子装进手机的瓶颈，终于被中国 AI 公司冲破了

开运体育世界杯中国官网首页将 600 亿参数大模子装进手机的瓶颈，终于被中国 AI 公司冲破了

发布日期：2026-05-27 15:52 点击次数：64

一个 8B 参数的大模子，频频需要约 16GB 显存。参数越多，越吃显存，这即是为什么，内存价钱一天比一天高。

咫尺，有一种形态，不错省下 6 倍显存，却险些不损耗模子性能。

畴昔两年，围绕这个看似极点的想路，一条众人道的时代竞赛正在成型。而就在这条赛说念上，一个都备基于国产算力的有规划，刚刚给出了我方的第一个陈说。

模子被压到了不到 3B，同期，智商却不错保留 97%，以致更进一步，如若勾通 MoE 架构，将来不错径直在一部 8GB 内存的手机，运行 600 亿参数的大模子。

听上去匪夷所想，怎么作念到的？

三个值，能跑大模子吗

传统大模子用荒谬精准的数字存储，意味着每个权重不错取几万种不同的数值，精度很高，但也很占内存。三值量化是一个极点的反向操作：径直把可选的数值从几万种砍到三种。时代上，这被称为 1.58-bit，因为编码三个值赶巧需要约 1.58 个二进制位。

这个压缩有多极点？打个比喻：如若传统大模子的权重是一幅全彩像片，三值量化即是把它压成唯有黑、白、灰三色的极简图形。

直观上你会认为这势必亏蚀惨重。但畴昔两年的照看反复讲解，模子权重里存在多半冗余信息。三个值，如若分派适应，足以承载绝大部分的模子智商。

这不是一个新观念。2024 年，微软照看院发布了 BitNet b1.58，第一次系统论证了三值大模子不错靠近全精度模子的性能。微软随后在旧年进一步发布了 BitNet b1.58 2B4T，一个 20 亿参数、4 万亿 token 考验的开源三值模子。上个月，好意思国公司 PrismML 发布了 Ternary Bonsai 系列，声称是首批交易可用的 1.58-bit 模子。

▲

上：Llama FP16架构，下：微软照看院开发的BitNet架构

学术界也相通在跟进：Tequila 忽视了照料三值量化中「死权重陷坑」的新形态，TernaryLM 探索了从零开动的原生三值考验。

一条众人赛说念正在成型。但有一个关节问题经久莫得被陈说：

三值大模子考验，能在国产算力上跑通吗？

昇腾上的第一次

这一次，在华为鲲鹏昇腾开发者大会（KADC 2026）上，面壁智能给出了谜底。

BitCPM-CANN 是面壁智能麇集清华大学、OpenBMB 开源社区发布的三值大模子系列。它的意旨不仅在于「又发了一个三值模子」。在众人赛说念上，BitCPM-CANN 作念到了三个此前莫得东说念主作念到的事情。

第一次，在华为昇腾上端到端完成三值大模子考验。此前所有这个词公开的三值模子考验都在 NVIDIA GPU 上完成。国产芯片阵营第一次领有了我方的三值考验智商。

第一次，一次性把范畴推到 8B。此前昇腾上的低比特考验停留在较小范畴的考证阶段。BitCPM-CANN 径直发布了 0.5B、1B、3B、8B 四个档位，笼罩从手机到 PC 的竣工端侧场景。

第一次，竣事了与全精度模子的竣工对照评测。11 项任务、四大类评测（知识、阅读斡旋、学科知识、数学推理），NBA下注(中国)官网入口1B 到 8B 档位的智商保留率在 95.7%到 97.2%之间。

97.2%的智商保留率意味着什么？在 ARC、CMMLU、GSM8K 等主流评测中，BitCPM-CANN 三值模子与同尺寸 MiniCPM4 全精度模子的差距，照旧小于很多全精度模子之间的差距。其中，3B 档位的保留率最高，达到 97.2%。

星空体育app2026世界杯官方下载

况兼，这不仅仅论文里的数字，是能真实不错「拿来就用」的效果。BitCPM-CANN 的一齐尺寸版块照旧开源，0.5B 到 8B 四个档位都不错径直下载复现。

关于熟谙面壁智能 MiniCPM 系列的开发者来说，BitCPM-CANN 即是 MiniCPM 家眷的三值版块，照旧一套生态。在合并个 GitHub 社区，家眷前辈累积了 3 万颗星、Hugging Face 总下载量超 3000 万的「家产」，咫尺助长出来了新的标的。

6 倍显存，从办事器平直机都「吃到红利」

比拟 BF16 全精度模子，BitCPM-CANN 任性约 6 倍显存，这个数字开发者最能径直感知：一个 8B 参数的全精度模子需要约 16GB 显存，BitCPM-CANN 三值版块不到 3GB，不错流通运行在一部手机上，协作 MoE 与激活范围拘谨，60B 范畴的模子有望装入末端开辟。

硬件端也照旧准备好了。高通最新的旗舰芯片 8850 和 8397 撑持 2-bit 原生推理，BitCPM-CANN 提供的赶巧是不错径直喂进去的低比特权重。

芯片厂商等供给，模子厂商等芯片，咫尺双方同期到位了，开运·体育世界杯(中国)官方网站怎么不是一种「双向奔赴」。

手机厂商对端侧大模子的参预一直在加快。上周 Google I/O 上，Gemini Intelligence 全面接管 Android 开辟，从手机平直表到车机；苹果也将在 6 月 WWDC 上展示下一代 Apple Intelligence 的紧要升级。

两大手机操作系统同期发力，共同指向一个现实：手机端侧要跑越来越强的 AI，内存即是最硬的瓶颈。谁能用更少的内存跑更强的模子，谁就掌合手了下一轮竞争的主动权。

执行上，如若勾通通盘 AI 产业正在履历的阵痛，价值又会更进一竿：4 月时，高盛把全年 DRAM 价钱涨幅预期上调到 280%，好意思银预估众人 HBM 阛阓将达到 546 亿好意思元。

AI 基础形态最紧缺的资源即是内存，6 倍显存红利意味着不加多物理内存，就能把模子智商进步数倍。在内存不息加价的情况下，这不是优化，是刚需。

三值量化不是「用精度换内存」的调解。当 97%的智商被保留住来时，阐发传统 16 位模子里多半的精度可能是冗余的。三个值，足以承载一个大模子的绝大部分知识。低比特不再是工程上的任性技巧，而是一种新的权重知识承载神气。

为什么是面壁智能，为什么是咫尺

当 AI 从云霄走向末端，端侧模子正在成为个东说念主智能开辟的中枢智商。手机、电脑、车机，每一个贴近用户的末端都在等一个饱和小、饱和强、饱和省内存的模子。这条赛说念的赢输手，不会是那些只会把模子作念大的团队，而是能把模子作念小、作念轻、作念到真实能跑起来的玩家。

为什么是面壁智能，能在端侧大模子这条路上，一直走在前沿？这个问题的谜底不在 BitCPM-CANN 自身，而在这家公司畴昔几年，一直在作念的一件看起来有些「不对群」的事。

面壁智能从开发之初就押注效用，在国内大多数团队追赶更大模子的时候，他们花了多半时候作念底层考验框架 BM-Train，照料「怎么用更少的资源，训出饱和好的模子」，这套基础形态累积是其后一切的起始。

在 1.58-bit 方朝上，面壁智能的判断早于行业共鸣。很多数团队还在瞻念望极低比特是否可行时，面壁智能就采用了这条门路，先在 GPU 上跑通了竣工的考验经由和形态论，再合座搬动到昇腾平台上。不错说，BitCPM-CANN 不是把一个模子移植到了国产芯片上，而是把一整套经过考证的考验形态、效用门路和工程体系，搬进了国产算力的底座。

在模子层面，面壁智能的端侧模子 MiniCPM 系列在 GitHub 上累积了进取 3 万颗星，Hugging Face 开源总下载量进取 3000 万，是端侧大模子边界最受宽容的中国开源模子家眷。

BitCPM-CANN 恰是 MiniCPM 家眷向三值量化的延长，远不啻一个展示性的「PPT 模子」，是一个真实可复用的工程地基。它背后的考验链路照旧被千里淀为昇腾低比特考验的基础形态，后续所有这个词想在昇腾上作念低比特考验的团队，都不错在合并套底座上起步。

值得一提的是，BitCPM-CANN 还在华为昇腾上完成了端到端的三值考验，考验效用达到老例基线的 95%。这讲解了这套形态论不依赖特定硬件平台，国产算力相通不错跑通。

不是等硬件变得饱和精深来相宜模子，要让模子变得饱和智谋来相宜硬件。

从考验端的华为昇腾，到推理端的末端芯片，再到开源的模子和考验剧本，这是一条竣工的国产闭环，框架国产，芯片国产，模子国产，形态论自主。面壁智能的下一步照旧明确：进一步进步模子的智商保留率，用 MoE 架构推广更大范畴模子的容量，把 6 倍显存红利竣工开释到部署中。更永久的贪图，是笼罩从预考验到对都的全经由低比特化。

从底层考验框架 BM-Train，到端侧模子家眷 MiniCPM，再到 BitCPM-CANN，面壁智能用几年时候搭建了一套竣工的端侧大模子时代体系。在众人赛说念上，靠近微软、PrismML，面壁智能展现出了私有的不同上风之处在于：从框架、形态论、模子到芯片适配，构建了一条竣工的端侧时代门路。

当 AI 竞争从「谁的模子更大」转向「谁能让智能真实跑在每一台开辟上」时开运体育世界杯中国官网首页，掌合手端侧时代讲话权的东说念主，才站在了最成心的位置。

　　声明：新浪网独家稿件，未经授权不容转载。 -->

上一篇：开运·体育世界杯(中国)官方网站中国芯片走出不同于西方的路，玉渊谭天谈我国半导体范围高压下终了冲破

下一篇：开运·体育世界杯(中国)官方网站华为 MatePad Pro Max 旗舰平板官宣 6 月 1 日与 nova 16 系列手机同台发布

热点资讯

开运·体育世界杯(中国)官方网站江语晨12斤增重宣言：姐不卷了，吃饱万岁！
开运体育世界杯中国官网首页哈弗茨赞萨内：他对年青球员匡助很大，固然媒体品评他但他是
开运体育世界杯中国官网首页 FULL TIME 🔺中甲第9轮陕西衔尾客场3:0慑服
开运体育世界杯中国官网首页多部门协力防汛防灾
开运体育世界杯中国官网首页华为发布半导体“韬定律”：以逻辑折叠解围摩尔极限
开运体育世界杯中国官网首页中国男篮热身赛降服塞尔维亚劲旅 王俊杰砍

开运世界杯技术统计

开运体育世界杯中国官网首页 将 600 亿参数大模子装进手机的瓶颈，终于被中国 AI 公司冲破了

热点资讯

友情链接：

开运体育世界杯中国官网首页将 600 亿参数大模子装进手机的瓶颈，终于被中国 AI 公司冲破了