6月6日晚,面壁智能发布端侧大模型MiniCPM 4.0。该公司称新模型通过自研CPM.cu推理框架,在极限场景下实现最高220倍提速,常规5倍提速,支持在vLLM、SGLang、LlamaFactory等框架部署。

界面新闻
只服务于独立思考的人群
6月6日晚,面壁智能发布端侧大模型MiniCPM 4.0。该公司称新模型通过自研CPM.cu推理框架,在极限场景下实现最高220倍提速,常规5倍提速,支持在vLLM、SGLang、LlamaFactory等框架部署。
广告等商务合作,请点击这里