全球AI Lab排名第9的Agnes AI宣布无限期免费开放文本、图片、视频三款核心模型API,开发者零成本调用全模态能力


全球AI Lab排名第9的Agnes AI宣布无限期免费开放文本、图片、视频三款核心模型API,开发者零成本调用全模态能力
如果你在做 Agent、设计工作流或短视频生产,需要同时调用文本、图片、视频模型,Agnes AI 刚刚给了一个很难拒绝的方案:三款核心模型 API 无限期免费开放。
这意味着你不再需要为 Token 消耗精打细算,也不再需要在多个平台之间来回切换。一个 API 体系,覆盖文本生成、图像编辑、视频生成三种能力。
Agnes AI 是一家位列全球 AI Lab 排名第 9 的实验室,在 PinchBench、Claw-Eval 和 Artificial Analysis 等国际评测体系上持续上榜。它的核心产品线包括三款模型:
自 2026 年 6 月 1 日起,上述三款模型 API 面向全球开发者无限期免费开放。
三款模型覆盖文本、图像、视频三大模态,统一API体系
Agnes-2.0-Flash 支持代码开发、企业知识库、智能客服、文档处理及 Agent 工作流等场景。实测中,它能完成几个令人印象深刻的任务:
场景一:网页游戏生成。一个 Prompt 即可生成完整的飞机大战游戏,包含战机、小怪、Boss 战、计分系统、生命值、连击提示、粒子爆炸和动态星空背景。
场景二:产品原型搭建。只需一句提示词,就能生成 MBTI 人格测试网站,包含完整测试流程、结果计算逻辑和人格类型展示页面。
场景三:前端 UI 生成。用复杂 Prompt 描述需求后,模型能把产品需求、UI 结构、交互逻辑和视觉风格整合到一个可运行的 HTML 文件中。
# 示例 Prompt:生成地图应用
帮助我构建高德地图类型的地图App,以北京市东城区为起点。
地图要可以放大缩小,输入目的地起始点,移动端垂直屏APP界面,
地图应用UI设计,简洁界面,分层UI布局,圆角布局...
Agnes-2.0-Flash 根据复杂Prompt生成的地图应用交互稿
Agnes-Image-2.0-Flash 最大的特点不是生成图片,而是编辑图片。它支持图改图、多图融合、背景替换、局部编辑、文字修改和风格转换。
人像精修:在大幅修改人物造型的同时,人脸一致性保持稳定。皮肤纹理、光影层次和镜头质感都接近商业摄影水平。

在大幅修改人物造型时人脸一致性保持稳定
电商海报:上传一张产品实拍照片,模型自动生成包含产品卖点文案、视觉装饰元素和电商风格版式的完整海报。
信息图:能根据需求生成流程图、知识科普图,甚至根据海洋生物特征生成建筑概念设计信息图,自动组织版面结构。
信息图自动生成,包含流程结构、图标和视觉引导符号
Agnes-Video-V2.0 支持音画同步生成,这是它区别于大多数视频模型的关键能力。输出分辨率可选 720P 或 1080P。
音乐演奏场景:画面中的鼓手演奏动作与鼓点时机保持同步,乐队画面中主唱、吉他手和鼓手三名人物的动作与对应声音基本匹配。
电影质感场景:人物口型与台词对应,面部表情和情绪变化随对话内容调整,整体画面接近实景拍摄效果。
人物表演场景:通过眼神、呼吸和面部细节传递情绪,呈现层次感丰富的表演,接近影视作品中的表演方式。
三款模型的 API 接口风格统一,支持在同一个项目中混合调用,构建完整的多模态工作流。
| 能力 | Agnes AI | 竞品方案 |
|---|---|---|
| 文本+图片+视频 API | 统一体系,一套 API | 通常需要对接 2-3 个平台 |
| 价格 | 无限期免费 | 按 Token 计费,月成本数百到数千 |
| 图像编辑能力 | 原生支持图改图、局部编辑 | 多数只支持文生图 |
| 视频音画同步 | 原生支持 | 多数需要后期配音 |
| 上下文窗口 | 1M tokens | 通常 128K-256K |
Agnes AI 的免费策略不是因为它能力弱,而是它在赌一个趋势:当 API 调用成本归零,开发者的试错空间会被极大释放,应用生态会加速扩张。对于预算有限的中小团队和个人开发者来说,这个赌注值得关注。

阶跃星辰发布Step 3.7 Flash,400 tokens/秒推理速度,11B激活参数实现Claude Opus 4.6的97%性能,开源可本地部署

阶跃开源Flash模型实测接入Claude Code,用复杂Agent工作流验证国产模型能否顶上闭源基座

OpenAI Codex正式支持Windows电脑操作,附完整开启步骤、限制说明和手机远程控制方法