返回精选推文
Andrew Ng

Andrew Ng

@AndrewYNg·2026/05/12·1周前

根本不会有什么 AI 失业末日。 “AI 将导致大规模失业”的说法正在制造不必要的恐慌。AI 和其他任何技术一样,确实会影响就业,但夸大其词地渲染大规模失业是不负责任且有害的。让我们停止这种论调。 我之前就表达过对“失业末日”论的怀疑。很高兴看到主流媒体现在也开始反击这种说法。下面的图片展示了一些近期的头条新闻。 软件工程是受 AI 工具影响最大的领域,因为编码智能体正在飞速发展。然而,软件工程师的招聘依然强劲!所以,尽管存在 AI 取代部分工作的例子,但趋势强烈表明,净增加的就业岗位远远多于被淘汰的岗位——就像之前的技术浪潮一样。此外,尽管 AI 取得了令人振奋的进展,但美国的失业率仍保持在健康的 4.3%。 为什么 AI 失业末日论如此盛行?原因之一是,前沿 AI 实验室有强烈的动机去讲述那些让 AI 技术听起来更强大的故事。最极端的情况下,他们会宣扬 AI“接管”世界并导致人类灭绝的科幻场景。如果一项技术能取代大量员工,那这项技术肯定非常有价值! 此外,许多 SaaS 软件公司每用户每年的收费在 100 到 1000 美元之间。但如果一家 AI 公司能够取代一名年薪 10 万美元的员工——或者让其效率提升 50%——那么即使收费 1 万美元也开始显得合理。通过将价格锚定在员工薪资而非典型的 SaaS 价格上,AI 公司可以收取高得多的费用。 另外,企业也有强烈的动机将裁员归咎于 AI。毕竟,谈论他们如何利用 AI 以更少的员工实现更高的效率,会让他们看起来非常明智。这总比承认他们在疫情期间(当时资本因低利率和巨额政府财政刺激而充裕)过度招聘要好得多。 需要说明的是,我承认 AI 正在改变很多人的工作方式。这很艰难,也很有压力。(对某些人来说,也可能很有趣。)我对所有受到影响的人感同身受。但同时,这与预测就业市场崩溃是完全不同的两码事。 社会有能力多年沉浸在与现实脱节的故事中,并因此做出糟糕的全局决策。例如,对核电站安全的恐惧导致了核能投资不足;20 世纪 60 年代对“人口爆炸”的恐惧导致一些国家实施了严厉的减少人口政策;而对膳食脂肪的担忧则让政府在几十年里推广不健康的高糖饮食。 如今,既然主流媒体已公开对“失业末日”论表示怀疑,我希望这些故事会开始失去影响力(就像对 AI 导致人类灭绝的恐惧一样)。 与 AI 失业末日的预测相反,我预测的情况恰恰相反:我们将迎来一场 AI 就业狂欢!AI 将催生大量优质的 AI 工程岗位,我对整体就业市场的未来也持乐观态度。AI 工程师的工作内容将不同于传统的软件工程,其中许多岗位将出现在传统大型开发者雇主之外的企业中。在非 AI 岗位中,所需的技能也会因 AI 而改变。因此,现在是鼓励更多人精通 AI 的好时机,确保他们为未来那些不同但充足的就业机会做好准备! [原文来自 The Batch 通讯。]

Tweet media 1
1.9K422252178.2K

相关推文

吴恩达推出了图灵-通用人工智能测试,这是一个旨在通过衡量计算机执行真实世界工作任务的效率能否媲美熟练人类,来评估真正的通用人工智能(AGI)的新基准,以此对抗不切实际的 AI 炒作。

2026 新年快乐!今年会是我们最终实现通用人工智能(AGI)的一年吗?我想提出一个新版图灵测试,我称之为图灵-通用人工智能测试,以验证我们是否真正实现了通用人工智能。我稍后会解释为什么拥有一个新测试如此重要。 公众普遍认为,通用人工智能的实现意味着计算机将拥有如同人类的智慧,能够胜任大部分甚至全部知识工作。我想提出一个新测试。测试对象——无论是计算机还是经验丰富的专业人士——都将获准使用一台配备互联网接入、网页浏览器和 Zoom 等软件的计算机。评委将为测试对象设计一个为期数天的工作任务体验,所有互动都将通过计算机进行。例如,这个体验可能包括一段培训期(比如,作为呼叫中心接线员),随后被要求执行任务(接听电话),并获得持续反馈。这模拟了远程工作者在拥有功能完备计算机(但无摄像头)情境下的工作状况。 如果一台计算机能像熟练的人类一样出色地完成工作任务,那么它就通过了图灵-通用人工智能测试。 大多数公众成员可能相信,一个真正的通用人工智能系统会通过这项测试。当然,如果计算机的智能水平能与人类匹敌,它们理应能够像被雇佣的人类一样高效地完成工作任务。因此,图灵-通用人工智能测试与人们普遍理解的 AGI 含义相符。 这就是为什么我们需要一个新测试:“AGI”已经变成了一个炒作的词汇,而非一个具有精确定义的术语。一个合理的 AGI 定义是,能够完成人类所能进行的任何智力任务的 AI。当企业大肆宣扬他们可能在几个季度内实现通用人工智能时,他们通常会通过大幅降低标准来为其主张寻找依据。这种定义上的不匹配是有害的,因为它让人们认为人工智能变得比实际更强大。我看到这误导了从高中生(他们认为 AGI 即将到来,从而避免某些学习领域)到首席执行官(他们正在决定投资哪些项目,有时假设人工智能在 1-2 年内将比任何可能的现实更强大)的所有人。 原始图灵测试要求计算机通过文本聊天“欺骗”人类评委,使其无法辨别出它是机器而非人类,但这并不足以证明其具备人类水平的智能。洛布纳奖竞赛实际运行了图灵测试,结果发现要成功“欺骗”评委,模拟人类打字错误的能力可能比实际展示智能本身更为关键。当前人工智能发展的一个主要目标是构建能够完成具有经济价值的工作,而非仅仅“欺骗”评委的系统。因此,一个衡量工作能力的修订测试,将比衡量欺骗人类能力的测试更为有用。 对于今天几乎所有人工智能基准(例如 GPQA、AIME、SWE-bench 等),测试集都是预先确定的。这意味着人工智能团队至少在间接层面,会根据已发布的测试集来调整他们的模型。此外,任何固定的测试集都只衡量智能的一个狭窄片段。相比之下,在图灵测试中,评委可以自由提问以探究模型的能力。这使得评委可以测试计算机或人类知识的“通用性”究竟如何。同样,在图灵-通用人工智能测试中,评委可以设计任何体验——这些体验不会提前透露给被测试的 AI(或人类受试者)。这是衡量 AI 通用性的一种比预定测试集更好的方式。 人工智能正沿着惊人的轨迹持续进步。在过去的几十年里,过度炒作的期望导致了“人工智能寒冬”,当时对人工智能能力的失望导致了兴趣和资金的减少,直到该领域取得更多进展后才重新回升。少数可能阻碍人工智能发展巨大势头的原因之一,便是不切实际的炒作所造成的投资泡沫,这可能导致失望和兴趣的崩塌。为了避免这种情况,我们需要重新校准社会对人工智能的期望。一项测试会有所帮助。 如果我们举行图灵-通用人工智能测试竞赛,即使所有人工智能系统都未能通过,那也将是一件好事!通过化解围绕 AGI 的炒作并减少泡沫的可能性,我们将为人工智能的持续投资创造一条更可靠的道路。这将使我们能够继续推动真正的技术进步,并开发有价值的应用程序——即使这些应用程序远未达到 AGI。而如果这项测试能为一个团队设定一个明确的奋斗目标,让他们朝着实现 AGI 的荣耀迈进,那也将是极好的。我们可以确信,如果一家公司通过了这项测试,他们所创造的将不仅仅是一个营销上的发布——它将是无比宝贵的。 [原文链接:https://t.co/mGAmoOGga7 ]

AI资讯吴恩达通用人工智能图灵测试
1.5K255177160.7K

吴恩达(Andrew Ng)指出,企业若想通过 AI 获得变革性影响,必须超越零散的自下而上实验,转而采取自上而下的战略视角,对整个业务工作流进行端到端的重构。

企业如何才能超越单纯利用 AI 提升局部效率,从而创造出变革性的影响?我目前正在瑞士达沃斯参加世界经济论坛(WEF),并在现场撰写此文。在这里,我与许多 CEO 深入交流了如何利用 AI 驱动增长。一个反复出现的主题是:开展大量实验性的、自下而上的 AI 项目——即所谓的“百花齐放”——并没能带来显著收益。相反,更大的回报源于“工作流重构”:对流程中的多个步骤采取更宏观、甚至是自上而下的视角,从端到端彻底改变它们的协同方式。 以银行发放贷款为例,其工作流包含几个独立阶段: 营销 -> 申请 -> 初步审批 -> 最终审查 -> 执行 假设过去每个步骤都靠人工。如果初步审批原本需要 1 小时的人工审查,而现在用一个新的代理系统(Agentic System)在 10 分钟内自动完成。仅仅是将人工审查替换为 AI 审查,而保持其他环节不变,只能带来微小的效率提升,并不具备变革性。 真正的变革应该是这样的:与其让申请人等待一周才能得到人工审批结果,不如让他们在 10 分钟内就拿到决定。一旦实现这一点,贷款就变成了一款极具竞争力的产品,这种极佳的客户体验能吸引更多申请,最终提升放款量。 然而,实现这种转变需要从更广阔的业务或产品视角出发,而非单纯的技术视角。此外,它会改变贷款处理的整个工作流。要提供“10 分钟到账贷款”产品,就必须改变营销方式,申请过程需要全面数字化并实现更高效的流转,最终审查和执行环节也必须重构,以应对更大的业务量。 即便 AI 仅应用于“初步审批”这一步,我们最终实现的也不再是一个孤立的点状解决方案,而是通过重构工作流实现了产品服务的彻底转型。 在我共同领导的咨询公司 AI Aspire,我们观察到:自下而上的创新固然重要,因为最接近一线问题的人往往最先看到解决方案。但要将这些想法规模化并产生变革性影响,通常需要洞察 AI 如何端到端地重塑整个工作流,而不仅仅是单个步骤,这正是自上而下的战略指引和创新大显身手的地方。 与往年一样,今年的 WEF 会议同样充满活力。技术专家们热议的话题包括:代理式 AI(Agentic AI,当我首创这个术语时,完全没想到它会出现在满大街的广告牌和建筑上!)、主权 AI(Sovereign AI,即各国如何掌控自己的 AI 准入)、人才问题(应届生面临的就业挑战以及全民技能提升),以及数据中心基础设施(如何解决能源、人才、GPU 芯片和内存的瓶颈)。我将在未来的文章中详细探讨这些话题。 在全球地缘政治充满不确定性的背景下,我希望 AI 领域的同仁们能继续搭建连接各国的桥梁,通过开源进行分享,并为了造福所有国家和人民而持续创造。 [原文链接: https://t.co/Ck52mNGX4a ]

AI资讯AI 战略工作流重构业务转型
7371558873.8K

李继刚提出一种利用 AI 工具(Gemini)实现创新阅读的方法,通过双窗口 Prompt 将书籍“读厚”和“读薄”。

AI 时代,应有一套独有的「读书法」。 之前用过苏轼的「八面受敌读书法」、万维刚的「强力研读读书法」、以及「卡片读书法」,都是在AI 出现之前的读法。 现在我们拥有了这个大杀器,理应走出一条新路。 最近在不断尝试,其中一种方式: 1. 双开Gemini窗口 2. 左侧窗口写一个伴读Prompt,用于针对当前在读书目进行伴读,目标是将书「读厚」 3. 右侧窗口写一个生图Prompt,用于将左侧解读内容可视化,目标是将书「读薄」

Tweet media 1
AI资讯AI阅读GeminiPrompt Engineering
6481372272.8K

Andrej Karpathy 宣布他已加入 Anthropic,投身前沿 LLM 研发,同时他仍致力于教育事业。

个人动态:我已加入 Anthropic。我认为未来几年在 LLM 前沿领域将尤其具有决定性意义。我非常兴奋能加入这里的团队,并重返研发工作。我仍然对教育充满热情,并计划在未来继续从事这方面的工作。

AI资讯AnthropicAndrej KarpathyAI 人才
111.7K8.4K6.5K13.9M