IT之家 5 月 13 日消息,5 月 11 日,面壁智能聯(lián)合清華大學(xué)及 OpenBMB 開源社區(qū)正式發(fā)布并開源了新一代端側(cè)多模態(tài)大模型 MiniCPM-V 4.6。
該模型參數(shù)規(guī)模為 1.3B,在端側(cè)設(shè)備上僅需約 6GB 內(nèi)存即可流暢運(yùn)行,大幅降低了多模態(tài) AI 在各類智能終端的落地門檻。

目前,MiniCPM-V 4.6 已在 GitHub 和 Hugging Face 等平臺(tái)全面開源,并提供 Testflight 測(cè)試版本,可在 iOS、Android 和 HarmonyOS 等主流操作系統(tǒng)的手機(jī)上使用。

在性能表現(xiàn)方面,MiniCPM-V 4.6 在多個(gè)權(quán)威基準(zhǔn)評(píng)測(cè)中展現(xiàn)出優(yōu)于同尺寸主流模型的能力。
據(jù)介紹,它的 Instruct 和 Thinking 兩個(gè)版本均在通用圖文理解、STEM 數(shù)理推理、文檔 OCR 及視頻時(shí)序理解等任務(wù)上超越了 Qwen3.5-0.8B 和 Gemma4-E2B-it 等模型。

在最新的 Artificial Analysis 評(píng)測(cè)中,MiniCPM-V 4.6 以 13 分的成績(jī)超越了 Ministral 3 3B 等更大尺寸的模型,整體能力接近 Qwen3.5-2B 級(jí)別。

在效率方面,MiniCPM-V 4.6 實(shí)現(xiàn)了“參數(shù)更大、效率更高”的反超。盡管參數(shù)規(guī)模比 Qwen3.5-0.8B 更大,但在基于 vLLM 框架的推理測(cè)試中,它的 Token 吞吐量達(dá)到前者的 1.5 倍,而計(jì)算 Token 消耗僅為后者的 2.5% 左右。
在 Artificial Analysis 評(píng)測(cè)中,1.3B 非推理版本僅消耗約 540 萬(wàn) Token,僅為 Qwen3.5-0.8B 非推理版本的 1/19。這意味著開發(fā)者可以用同樣的硬件承載更多的線上流量,或者在端側(cè)實(shí)現(xiàn)更快的響應(yīng)速度。
性能與效率的提升主要得益于兩項(xiàng)技術(shù)創(chuàng)新:一是與清華大學(xué)聯(lián)合研發(fā)的 LLaVA-UHD v4 架構(gòu),通過(guò) ViT 內(nèi)部視覺(jué) Token“早壓縮”技術(shù),在保持性能的前提下將圖像編碼計(jì)算量降低了 55.8%;二是提供 4 倍和 16 倍混合視覺(jué) Token 壓縮模式,開發(fā)者可以根據(jù)應(yīng)用場(chǎng)景在性能優(yōu)先與速度優(yōu)先之間靈活選擇,兼顧高精度文檔解析和低算力環(huán)境下的實(shí)時(shí)交互需求。

在高分辨率圖像處理方面,MiniCPM-V 4.6 表現(xiàn)突出。處理 3132×3132 分辨率高清大圖時(shí),首字響應(yīng)延遲僅約 75.7 毫秒,較同基座規(guī)模的 Qwen3.5-0.8B 快 2.2 倍。在高并發(fā)場(chǎng)景下,單張 RTX 4090 顯卡每秒可處理 54.79 張 1344×1344 分辨率圖片,處理吞吐量約為 Qwen3.5-0.8B 的 1.5 倍。

在開源生態(tài)支持方面,MiniCPM-V 4.6 提供了從微調(diào)到部署的完整工具鏈,已適配 ms-swift 和 LLaMA-Factory 等主流微調(diào)框架,并支持 vLLM、SGLang、llama.cpp 和 Ollama 等多個(gè)高性能推理框架。開發(fā)者只需一張 RTX 4090 等消費(fèi)級(jí)顯卡即可完成全流程微調(diào)。


IT之家注意到,MiniCPM-V 系列此前已在汽車、PC、手機(jī)和智能家居等多個(gè)終端場(chǎng)景實(shí)現(xiàn)規(guī)?;涞?,合作伙伴涵蓋聯(lián)想、吉利、上汽大眾等數(shù)十家行業(yè)頭部企業(yè)。此次 MiniCPM-V 4.6 的開源,將進(jìn)一步推動(dòng)多模態(tài)大模型在端側(cè)設(shè)備的應(yīng)用效率。
參考資料:
Hugging Face:
https://huggingface.co/openbmb/MiniCPM-V-4.6GitHub:
https://github.com/OpenBMB/MiniCPM-VModelScope:
https://modelscope.cn/models/OpenBMB/MiniCPM-V-4.6GitCode:
https://ai.gitcode.com/OpenBMB/MiniCPM-V-4.6Web Demo:
https://huggingface.co/spaces/openbmb/MiniCPM-V-4.6-DemoAPP Demo:
https://github.com/OpenBMB/MiniCPM-V-Apps
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。