toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,022个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

MiniCPM-o 4.5:消费级显卡跑全双工多模态AI

2026/04/30
·toolin小编

面壁智能发布 MiniCPM-o 4.5 技术报告并开放全模态全双工 API,RTX 5070 即可本地实时运行边看边说的 AI 助手

MiniCPM-o 4.5:消费级显卡跑全双工多模态AI
MiniCPM-o 4.5:消费级显卡跑全双工多模态AI
2026/04/30

MiniCPM-o 4.5:消费级显卡跑全双工多模态AI

面壁智能发布 MiniCPM-o 4.5 技术报告并开放全模态全双工 API,RTX 5070 即可本地实时运行边看边说的 AI 助手

它能做什么三种使用方式在线体验(无需注册)API 调用(免费开放)本地部署(RTX 5070 即可运行)技术核心:Omni-Flow适用场景
AI产品

9B 参数的开源模型,能在一张消费级显卡上实现"边看、边听、边说、还能主动提醒"的全双工 AI 助手。MiniCPM-o 4.5 自 2026 年 2 月发布以来在 Hugging Face 上下载量已突破 25 万,现在技术报告正式发布,API、端侧安装包和 Demo 代码全部开放。

它能做什么

MiniCPM-o 4.5 是目前业界首个端到端全双工全模态大模型。全双工意味着你可以随时打断它、插话,不需要等它说完再开口。它能:

  • 实时语音对话(可设定音色和语速)
  • 实时视觉理解(通过摄像头看你的屏幕或桌面)
  • 主动提醒(观察到你忘记某件事时主动提醒)
  • 全程本地运行,无需联网,数据不出机器

三种使用方式

在线体验(无需注册)

手机端推荐访问:https://minicpmo45.modelbest.cn/mobile/

电脑端推荐访问:https://minicpmo45.modelbest.cn/

Demo 展示了三种交互模式:传统轮次交互、语音双工交互、视频双工交互。所有配置(包括 Prompt 和参考音频)都已开放,你可以自定义体验。

API 调用(免费开放)

MiniCPM-o 4.5 的 API 支持全模态全双工实时交互,全双工模式下无需 VAD(Voice Activity Detection)机制控制对话轮次,便于开发者基于它构建应用。

API 目前免费开放,文档地址:https://minicpmo45.modelbest.cn/docs

本地部署(RTX 5070 即可运行)

模型已基于 llama.cpp 完成量化和推理优化,最低 12GB 显存的 RTX 5070 即可流畅运行全双工模式(RTF 0.4)。

桌面软件 Comni 集成了模型下载、环境安装和 Demo 运行能力,提供 Windows / macOS 版本,一键安装。

Demo 的全栈代码也已开源:

  • GitHub 仓库:https://github.com/OpenBMB/MiniCPM-o-Demo

技术核心:Omni-Flow

技术报告首次公开了 Omni-Flow 流式全模态框架。核心思路是把语音、视觉、文本的输入输出统一到一条流式处理管线中,避免传统方案中各模态之间的串行等待。

关键数据:

  • 参数量:9B(端侧可部署级别)
  • 全双工延迟:RTF 0.4(实时率因子,低于 1 即表示快于实时)
  • 最低显存:12GB(RTX 5070)

技术报告 PDF:https://github.com/OpenBMB/MiniCPM-o/blob/main/docs/MiniCPM\_o\_45\_technical\_report.pdf

适用场景

  • 开发者:需要快速搭建带语音和视觉能力的 AI 助手原型
  • 隐私敏感场景:医疗、金融等需要数据不出本地的应用
  • 个人用户:想在电脑上拥有一个随时可用的本地 AI 助手
  • 教育研究:学习全双工多模态模型的实现方式
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
它能做什么三种使用方式在线体验(无需注册)API 调用(免费开放)本地部署(RTX 5070 即可运行)技术核心:Omni-Flow适用场景

相关文章

MiniCPM-o 4.5:消费级显卡跑全双工全模态AI助手
AI产品

MiniCPM-o 4.5:消费级显卡跑全双工全模态AI助手

面壁智能开源9B参数全双工全模态模型,12GB显存即可本地运行,支持边看边听边说,附在线Demo和一键安装包

avatar for toolin小编
toolin小编
2天前
OpenClaw大更新:AI智能体不再是黑箱
AI产品

OpenClaw大更新:AI智能体不再是黑箱

OpenClaw v2026.4.25版本接入13个语音提供商、OTEL全链路可观测性和插件冷启动优化,让Agent运行透明可控

avatar for toolin小编
toolin小编
2天前
SenseNova U1:开源的多模态图文创作模型
AI产品

SenseNova U1:开源的多模态图文创作模型

商汤发布 SenseNova U1 系列多模态模型,原生统一架构实现连续图文创作,免费开源,可作为 GPT Image 2 的国产替代方案

avatar for toolin小编
toolin小编
1天前