
DeepSeek 公布多模态推理新技术 Thinking with Visual Primitives,用坐标替代语言描述,在多项视觉推理任务上超越 GPT-5.4 和 Claude Sonnet 4.6

面壁智能发布 MiniCPM-o 4.5 技术报告并开放全模态全双工 API,RTX 5070 即可本地实时运行边看边说的 AI 助手

商汤发布 SenseNova U1 系列多模态模型,原生统一架构实现连续图文创作,免费开源,可作为 GPT Image 2 的国产替代方案

面壁智能开源9B参数全双工全模态模型,12GB显存即可本地运行,支持边看边听边说,附在线Demo和一键安装包

小米开源MiMo-V2.5和MiMo-V2.5-Pro两大模型,支持1M上下文、Token效率行业领先,附100万亿Token免费计划

OpenClaw v2026.4.25版本接入13个语音提供商、OTEL全链路可观测性和插件冷启动优化,让Agent运行透明可控

8B参数开源多模态模型,砍掉视觉编码器和VAE,支持信息图生成、连续图文交错输出,本地可部署,性能直逼GPT-Image-2

英伟达推出开源多模态推理模型,融合文本、视觉、语音,吞吐量达同类9倍,免费可用,支持本地至云端全场景部署

腾讯混元开源翻译模型Hy-MT1.5,极致压缩至440MB,支持33种语言离线互译,翻译质量超越谷歌翻译,手机端即可运行

GPT Image 2 上线即登顶 Arena 文生图榜,领先第二名 241 分,具备原生思考能力,文字渲染准确率 99%,API 出图仅 $0.21。

Meshy AI 发布新一代 3D 模型生成模型 Meshy 6,支持单图生成高精度雕塑级模型,覆盖游戏、3D打印等场景,累计用户已破千万。

Anthropic为Claude新增交互式图表和流程图功能,免费用户可用,支持生成可点击的周期表、时间线、决策树等可视化内容。