面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
- 分类:行业动态
- 作者:
- 来源:
- 发布时间:2025-06-09 09:30:58
- 访问量:382
【概要描述】【导语】6月7日,面壁智能发布了端侧大模型MiniCPM 4.0,该模型通过自研CPM.cu推理框架实现极限场景下220倍提速。此次发布的MiniCPM 4.0系列包括8B和0.5B两种参数规模,采用创新稀疏架构和“高效双频换挡”机制,兼顾长、短文本处理。MiniCPM 4.0支持在多个开源框架部署,带来90%的模型瘦身和速度提升,实现端侧推理的显著提升。 6 月 7 日消息,面
面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
【概要描述】【导语】6月7日,面壁智能发布了端侧大模型MiniCPM 4.0,该模型通过自研CPM.cu推理框架实现极限场景下220倍提速。此次发布的MiniCPM 4.0系列包括8B和0.5B两种参数规模,采用创新稀疏架构和“高效双频换挡”机制,兼顾长、短文本处理。MiniCPM 4.0支持在多个开源框架部署,带来90%的模型瘦身和速度提升,实现端侧推理的显著提升。 6 月 7 日消息,面
- 分类:行业动态
- 作者:
- 来源:
- 发布时间:2025-06-09 09:30:58
- 访问量:382
【导语】6月7日,面壁智能发布了端侧大模型MiniCPM 4.0,该模型通过自研CPM.cu推理框架实现极限场景下220倍提速。此次发布的MiniCPM 4.0系列包括8B和0.5B两种参数规模,采用创新稀疏架构和“高效双频换挡”机制,兼顾长、短文本处理。MiniCPM 4.0支持在多个开源框架部署,带来90%的模型瘦身和速度提升,实现端侧推理的显著提升。

6 月 7 日消息,面壁智能发布端侧大模型 MiniCPM 4.0。该公司称新模型通过自研CPM.cu推理框架,在极限场景下实现最高 220 倍提速,常规 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。
此次发布的一款 8B 闪电稀疏版,采用创新稀疏架构掀起高效风暴;另一款 0.5B 则被称作“轻巧灵动的最强小小钢炮”。
据官方介绍,此次面壁推出的 MiniCPM 4.0 系列 LLM 模型拥有8B、0.5B 两种参数规模,针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B 采用「高效双频换挡」机制,能够根据任务特征自动切换注意力模式:在处(chù)理(lǐ)高(gāo)难(nán)度(dù)的(de)长(zhǎng)文本(běn)、深(shēn)度(dù)思(sī)考(kǎo)任(rèn)务(wu)时,启用稀疏注意(yì)力(lì)以(yǐ)降(jiàng)低(dī)计(jì)算(suàn)复(fù)杂(zá)度(dù),在(zài)短(duǎn)文本(běn)场(chǎng)景(jǐng)下(xià)切换至稠密注意力以(yǐ)确(què)保(bǎo)精(jīng)度(dù),实(shí)现(xiàn)了(le)长(zhǎng)、短(duǎn)文本(běn)切(qiè)换(huàn)的(de)高(gāo)效(xiào)响(xiǎng)应(yīng)。
据(jù)了(le)解(jiě),MiniCPM 4.0 可(kě)在(zài)vLLM、SGLang、LlamaFactory、XTuner等(děng)开(kāi)源(yuán)框(kuāng)架(jià)部(bù)署(shǔ)。其(qí)内(nèi)置(zhì)自(zì)研(yán)CPM.cu极(jí)速(sù)端(duān)侧(cè)推(tuī)理(lǐ)框(kuāng)架(jià),从(cóng)投(tóu)机(jī)采样(yàng)创(chuàng)新(xīn)、模(mó)型(xíng)压(yā)缩(suō)量(liàng)化(huà)创新、端侧部署框架创新几方面,带来 90% 的模型瘦身和速度提升,官方宣称将实现端侧推理“从天生到终生”的丝滑。
扫二维码用手机看
官方网站-首页