
DeepSeek 公布多模态推理新技术 Thinking with Visual Primitives,用坐标替代语言描述,在多项视觉推理任务上超越 GPT-5.4 和 Claude Sonnet 4.6

面壁智能发布 MiniCPM-o 4.5 技术报告并开放全模态全双工 API,RTX 5070 即可本地实时运行边看边说的 AI 助手

商汤发布 SenseNova U1 系列多模态模型,原生统一架构实现连续图文创作,免费开源,可作为 GPT Image 2 的国产替代方案

GitHub 50K星标的开源桌面工具,支持在Claude Code、OpenClaw等6个Agent中一键切换模型,附带用量追踪和故障转移功能

面壁智能开源9B参数全双工全模态模型,12GB显存即可本地运行,支持边看边听边说,附在线Demo和一键安装包

小米开源MiMo-V2.5和MiMo-V2.5-Pro两大模型,支持1M上下文、Token效率行业领先,附100万亿Token免费计划

OpenClaw v2026.4.25版本接入13个语音提供商、OTEL全链路可观测性和插件冷启动优化,让Agent运行透明可控

8B参数开源多模态模型,砍掉视觉编码器和VAE,支持信息图生成、连续图文交错输出,本地可部署,性能直逼GPT-Image-2

通过CLAUDE.md、Skills和MCP三层上下文构建,让AI真正理解你的代码库,附OpenAI Symphony并行编排方案对比

开源Agent文档维护工具,自动审查项目文档体系并迭代更新,支持Claude Code、Codex、OpenCode、OpenClaw四个平台

英伟达推出开源多模态推理模型,融合文本、视觉、语音,吞吐量达同类9倍,免费可用,支持本地至云端全场景部署

腾讯混元开源翻译模型Hy-MT1.5,极致压缩至440MB,支持33种语言离线互译,翻译质量超越谷歌翻译,手机端即可运行