OpenAI 通过视频展示 Codex 如何帮助 iOS/macOS 开发者 Paul Solt 快速探索新框架并加速开发。
对于 iOS 和 macOS 开发者 @PaulSolt 而言,Codex 就像一位研究伙伴,帮助他探索新框架,并更快地实现他以前无法构建的想法。

每日精选海外AI圈最有价值的推文与见解,带你看清全球AI发展脉络
OpenAI 通过视频展示 Codex 如何帮助 iOS/macOS 开发者 Paul Solt 快速探索新框架并加速开发。
对于 iOS 和 macOS 开发者 @PaulSolt 而言,Codex 就像一位研究伙伴,帮助他探索新框架,并更快地实现他以前无法构建的想法。

AI 代码编辑器 Cursor 在 Compile 大会的主题演讲中宣布了三项更新,其中一项是与 SpaceX 合作训练新的 AI 模型。
我们在 Compile 大会的主题演讲中宣布了三项更新,其中包括我们正与 SpaceX 合作训练一个新模型。
LangChain 展示了 Patlytics,一个使用 LangSmith 编排其 AI 技术栈的企业级法律 AI 平台。
LangSmith 聚焦:@patlytics ✅ 专为整个专利生命周期打造的首选企业级法律 AI 平台。 ✅ 使用 LangSmith 编排其端到端的 AI 技术栈,从提示词管理到工作流评估。
LangChain 的 Deep Agents v0.6 引入了代码解释器,允许智能体在运行时内调用工具,从而减少往返次数和 Token 浪费。
Deep Agents v0.6 功能亮点:代码解释器。 智能体现在可以在运行时内部调用工具,将中间结果保留在模型上下文之外,仅将相关输出传回。 更少的往返次数。更少的 Token 浪费。 https://t.co/SwMTGEXeNX

Harrison Chase 区分了模型路由(以成本为导向)与模型议会(聚合多个模型以突破性能上限),并分享了当前观点,以及 LangChain 在成本控制上的实践。
最近一直在思考模型路由及相关问题。 以下是当前的一些想法,欢迎反馈: 1/ 「模型路由」和「模型议会」是有区别的。 「模型路由」= 路由到唯一最优模型。我认为这么做的唯一真正理由是成本。 「模型议会」= 同时将请求发送给多个模型,然后聚合结果。这么做是为了突破性能上限。 2/ 「模型议会」近期似乎正迎来高光时刻。@OpenRouter 推出了 Fusion,@SakanaAILabs 推出了 Fugu。 我确实认为它在某些场景下很有用——@nlarusstone 强调了他们如何将其用于棘手的生物学问题,以及最近的「最大自主权」案例。 我不确定如何用它来驱动主智能体,但作为「工具」来使用是合理的,类似于 Anthropic 的顾问工具。 3/ 理论上,模型路由听起来不错,我可能比 Dax 更看好它。我不认为让所有用户都清楚知道何时该用哪个模型是可行的。(也许在编程领域更可行一些,但我的思考范围更广)。提示缓存是一个实际问题。也许可以采取的策略是,一旦初始路由完成,就强烈倾向于不切换模型? 4/ 模型路由的主要目的是节省成本。但可能还有其他(更简单的)手段可以优先考虑。例如设置支出上限,也许可以按模型来设置(比如 Opus 分配 X 美元额度,之后只能用 Sonnet)。 在 LangChain,我们目前正在实施第(4)点(基础成本控制/策略:https://t.co/Fm3UsJ1qS8),但同时也在考虑路由和其他方案。
Gemini Spark 可充当项目审计员、新闻聚合器、品牌健康监测器、销售谈判教练、Drive 整理助手和客户会议准备助手。
🔍 项目跟踪审计员:将会议纪要与项目跟踪表交叉比对,标记过时信息和遗漏事项。 📰 新闻通讯聚合器:扫描 @Gmail 中的新闻通讯,提取并研究高价值链接,整理成结构化的每日摘要。 📈 品牌健康审计员:每周获取一份关键主题摘要,内容来自你企业在 @GoogleMaps 的评论和 @YouTube 视频中的用户反馈。 👨💼 销售谈判教练:运用企业软件销售策略,起草邮件应对折扣请求,识别买家限制条件,并维护合同价值。 📦 Drive 整理助手:审计 @GoogleDrive 中放错位置的文件,经你批准后批量重新整理。 📅 客户会议准备:搜索日历、邮件和文档获取上下文,起草战术性会议议程,并将其附加到你的「客户会议议程」@GoogleDocs 中。
Gemini Spark 现已在美区向 Google AI Ultra 订阅用户推出 Beta 版,仅限于该套餐用户使用。
Gemini Spark 现已面向 Google AI Ultra 订阅用户推出 Beta 版,从美国开始。 在评论区分享你的使用体验吧 👇
Google Gemini 宣布推出 Gemini Spark,一款可在用户指导下自动完成端到端任务的全天候个人 AI 智能体。
Gemini Spark 是你的全天候个人 AI 智能体,在你的指导下,从开始到结束处理繁重任务。 以下是我们团队使用 Gemini Spark 让生活更轻松、更高效的一些方法。🔥
LangChain 宣布 LangSmith Fleet 的入门流程大幅简化,Developer 和 Plus 计划用户可免费使用 Fireworks AI 提供的模型进行体验。
提醒一下:现在开始使用 LangSmith Fleet 比以往任何时候都更容易了。 Developer 和 Plus 计划用户可免费使用由 @FireworksAI_HQ 驱动的模型。 快来试试吧,告诉我们你的想法!

OpenAI 宣布推出 Codex Security Plugin,支持深度扫描、漏洞验证、攻击路径追踪和代码库专属补丁生成。
面向安全团队的 Codex Security Plugin:深度扫描、验证发现、追踪攻击路径、构建威胁模型、生成代码库专属补丁以供审查,并可导出至其他工具:https://t.co/jxlKnsQOAw
OpenAI 宣布推出完整版 GPT-5.5-Cyber,在 CyberGym 上达到最先进性能,并启动 Patch The Planet 和 Codex Security 两项新安全计划。
我们希望帮助所有公司实现安全,与美国政府及安全生态系统携手合作。 * GPT-5.5-Cyber 完整版现已发布;在 CyberGym 上达到最先进性能。 * Patch The Planet 和 Codex Security 将致力于解决安全问题,而不仅仅是发现它们。

LangChain 解释了 LangSmith Engine 的每次修复如何自动创建自定义评估器和数据集,从而逐步优化智能体的测试工具。
LangSmith Engine 解决的每个问题,都会让你的评估套件变得更强。 修复一个 Bug → 获得一个自定义的在线评估器 + 一个新的离线数据集样本。 久而久之,你的测试工具会越来越了解你的特定智能体。

谷歌宣布 Interactions API 正式可用,该 API 可在同一界面内编排多个模型和智能体,并成为新的默认 API。
今天,我们正式将 Interactions API 推向 GA。这是一款全新的 API,让你可以在同一界面内跨模型和智能体进行编排,也是我们未来的默认 API。Interactions 为智能体的新时代奠定了基础 : ) https://t.co/QJPN8kTH83
OpenAI 在 Daybreak 中的新工具和模型现可发现并生成针对主流浏览器、网络基础设施和操作系统关键漏洞的补丁。
除了发现漏洞,我们正通过 OpenAI Daybreak 的新工具和模型加速漏洞修复。 我们的模型现在能够发现并生成针对主流浏览器、网络基础设施和操作系统(如 FreeBSD 和 Linux 内核)关键漏洞的补丁,并为 cURL、Go、Python、Sigstore 和 pyca/cryptography 等项目提供修复方案。 我们正与合作伙伴及整个生态系统携手,共同守护全球软件安全:
We’re also launching the OpenAI Daybreak Cyber Partner Program with leading security software and services providers. Participating partners can use GPT‑5.5 with Trusted Access for Cyber in the security products and services they provide to customers. This allows their customers to benefit from the model’s defensive capabilities and make their software more resilient, but keeps direct model access in the hands of participating partners.
OpenAI 详细介绍 Patch the Planet 计划,该计划与安全公司合作,利用 Codex Security 和先进模型进行开源漏洞修复,并以人工审核为核心。
Patch the Planet 是我们帮助开源维护者从发现安全漏洞到完成合并修复的一项努力。 我们正与 Trail of Bits、HackerOne、Calif、研究人员以及维护者合作,将 Codex Security 和先进模型引入修复流程,并以人工审核为核心。
OpenAI 宣布扩展 Daybreak 网络安全计划,推出 Codex Security 插件、GPT-5.5-Cyber 模型、Cyber Partner Program 以及 Patch the Planet 计划,旨在加速漏洞修复。
我们正在扩展 OpenAI Daybreak,以帮助以机器速度普及易受攻击软件的修补工作: - Codex Security 插件:在 Codex 内部直接发现、验证和修复漏洞 - 完整版 GPT-5.5-Cyber 模型:为可信赖的防御者打造的出色模型 - Cyber Partner Program:支持领先安全公司在我们的顶级网络安全能力基础上构建产品,以保护全球软件 - Patch the Planet:与维护者合作,保护关键开源项目 https://t.co/hyIi6gQmkm
LangChain 列出了团队在跨生产环境安全、一致且可靠地构建智能体时必须关注的六个关键领域。
随着 Agent 的采用不断增长,团队需要一种可重复的方式,来跨生产环境安全、一致且可靠地构建大量智能体。 团队需要共享的方式来管理: ✅ 成本与使用量 ✅ 工具访问与审批 ✅ 人在回路工作流 ✅ 提示词、技能和上下文的版本管理 ✅ 跨团队的可复用资产 ✅ 跨生产环境智能体的监控与评估
LangChain 邀请团队参加 6 月 24 日由 Harrison Chase 主持的免费网络研讨会,学习如何构建生产就绪的 Agent 治理体系。
良好的治理不是为了拖慢团队。它是为了在不失去可见性、控制力或一致性的前提下,实现快速迭代。https://t.co/EArNH3C8hb 在 6 月 24 日加入 @hwchase17,学习团队如何将 Agent 从实验阶段转变为可重复的生产实践。

Chime 的 Philipp Comans 在 Interrupt 大会上分享了他们如何围绕领域专家知识构建评估系统,以平衡产品速度与合规要求。
「好的评估是加速的关键」 在 Interrupt 大会上,来自 @Chime 的 Philipp Comans 分享了他们如何平衡产品速度与合规性,围绕领域专家的知识构建评估系统。 https://t.co/YHsqiQ4pqd