报告:AI 目前和人类工作之间的关系
早上七点,李笑来发给我个链接,内容是OpenAi的强劲对手,Claude 背后的 AI 初创公司 Anthropic 刚刚发布一份38页的新报告,根据自己平台的数据,分析 AI 和人类工作之间的关系。在未来几年,人工智能系统将对人们的工作方式产生重大影响。为此,我们推出了"Anthropic经济指数",这是一项旨在长期了解人工智能对劳动市场和经济影响的计划。该指数的首份报告基于Claude.ai平台上数百万次匿名对话,首次提供了独特的数据与分析,清晰展示了人工智能如何融入现代经济中的实际工作任务。我们同时开源了此分析所用的数据集,以便研究者在此基础上扩展研究成果。制定应对劳动市场变革及就业与生产力影响的政策需要多视角参与,因此我们也邀请经济学家、政策专家和其他研究者对此指数提出建议。当前使用集中领域:人工智能使用集中于软件开发和技术写作任务。约36%的职业在至少25%的相关任务中使用AI,而约4%的职业在75%以上的任务中使用AI。增强与自动化比例:AI使用更偏向增强人类能力(57%),而非完全自动化任务(43%)。增强场景包括验证(如复查用户工作)、学习(辅助掌握新技能)和任务迭代(帮助头脑风暴)等。薪酬相关性:AI在中高薪酬职业(如程序员和文案撰写)中应用最多,但在最低和最高薪酬岗位中应用较少,可能反映出当前AI能力的局限性和技术应用门槛。各职业类别AI使用对比(基于Claude对话数据):商业与金融类:5.9% 低使用领域包括农业渔业(0.1%)和运输业(0.3%)。研究方法:通过"Clio"工具分析约100万次Claude对话,参照美国劳工部O*NET数据库(包含2万个工作任务分类),将对话按职业任务匹配。研究聚焦任务级别分析,而非整体职业替代。限制与展望:当前数据无法完全区分工作/非工作场景中的AI使用,且部分API用户数据未纳入。计划持续跟踪AI使用演变,未来将持续更新数据集和研究结论。Anthropic发布首个聚焦AI经济影响的"Anthropic经济指数",基于Claude.ai平台百万次对话数据得出关键结论:应用现状:AI已在36%职业的25%+任务中应用,但深度渗透(75%+任务)仅占4%。软件开发(37.2%)和创意写作(10.3%)是主要应用场景。功能模式:57%的AI使用属于"能力增强"(协作迭代/知识学习),43%为任务自动化。收入相关性:中高收入岗位(如程序员)应用最多,而体力劳动岗(农业)和高专业性岗(产科医生)使用率最低。开放合作:研究数据集已开源,并邀请学界参与后续分析,以追踪AI对劳动市场的长期影响。研究揭示了当前AI渗透更倾向于任务协同而非职业替代,提示未来工作转型而非消失的可能性。后续将长期监测自动化/增强比例变化及技术扩散模式。《Anthropic 经济指数》
在未来几年中,AI 系统将对人们的工作方式产生重大影响。正因如此,我们推出了 **Anthropic 经济指数**——这是一个旨在长期追踪和理解 AI 对劳动力市场及经济影响的项目。该指数的首份报告基于数百万条匿名的 Claude.ai 对话数据,提供了前所未有的数据信息和分析,清晰呈现了 AI 如何在现代经济中被应用于各类实际任务。我们还将公开此次分析所使用的数据集,以便研究人员在我们的成果基础上进一步探索和扩展。制定针对未来劳动力市场转型及其对就业与生产力影响的政策响应,需要多方观点的综合。因此,我们也邀请经济学家、政策专家以及其他研究人员对该指数提供意见和建议。- 目前,AI 的应用主要集中在软件开发和技术写作任务上。- 超过三分之一的职业(约36%)在至少四分之一的相关任务中使用 AI;- 约4%的职业在其任务中使用 AI 的比例高达75%及以上。- AI 的应用更倾向于“增强”模式(57%):与人类协作、提升人类能力;- “自动化”模式(43%):AI 直接替代人类完成任务。- 在中高收入的职业(例如计算机程序员和数据科学家)中,AI 的应用更为普遍;- 而在最低薪与最高薪的职位中,AI 的使用率均较低。- 这既反映了当前 AI 能力的局限,也体现了实际应用中的各种障碍。人工智能在经济中的应用范围和方式,这些数据来自 Claude.ai 的真实使用数据。这些数字指的是与 Claude 对话中与个别任务、职业和类别相关的百分比。我们的新报告延续了从工业革命时期的纺纱机到当今汽车制造机器人等技术对劳动力市场影响的长期研究。此次我们聚焦于 AI 的持续影响。我们既没有通过调查人们的 AI 使用情况,也不试图预测未来,而是基于实际数据直接反映 AI 的应用现状。我们的研究始于经济学文献中的一个重要洞见:有时关注具体的**职业任务**比关注整个职业更为合理。不同工作往往共享某些任务和技能,例如视觉模式识别既是设计师、摄影师、安全检查员以及放射科医生的共同任务。某些任务比其他任务更适合通过新技术实现自动化或增强。因此,我们预期 AI 会在不同职业中的不同任务上有选择地得到应用,对任务进行细致分析可以更全面地展现 AI 如何融入经济活动。### 利用 Clio 将 AI 应用匹配到任务上这项研究得益于 Claude 提供的洞察与观察,我们开发了自动化分析工具 **Clio**,该工具能在保护用户隐私的前提下自动分析与 Claude 的对话。- 使用大约一百万条 Claude 对话数据(主要来自 Claude.ai 免费版和专业版),- 利用 Clio 将这些对话按职业任务进行归类。- 我们依据美国劳工部的分类选择任务。劳工部维护着一个包含约20,000项具体工作任务的数据库,称为“职业信息网络”(O*NET)。- Clio 将每条对话与最能代表该对话中 AI 角色的 O*NET 任务进行匹配,然后按照 O*NET 方案将任务归类到对应的职业,并进一步划分为诸如教育与图书馆、商业与金融等几个大类别。我们的 Clio 系统将与 Claude 的对话(严格保密;左上)转化为职业任务(中上)和职业的过程。- AI 采用率最高的任务和职业类别是“计算机与数学”类,主要涵盖软件工程相关岗位。- 37.2% 的查询归属于此类别,涉及软件修改、代码调试、网络故障排查等任务。- 第二大类别为“艺术、设计、体育、娱乐与媒体”,占查询量 10.3%,主要反映人们利用 Claude 进行各类写作和编辑工作。- 高体力劳动的职业(例如“农业、渔业和林业”)查询量仅占 0.1%。- 我们还将数据中各职业的 AI 使用率与其在劳动力市场中的整体占比进行了比较,比较结果如下图所示:对于每种工作类型,与 Claude 相关的对话的百分比以橙色显示,而美国经济中从事该工作类型的工人百分比(来自美国劳工部的 O*NET 类别)则以灰色显示。- “计算机与数学”类虽然只占 3.4% 的劳动力,但其 AI 使用率高达 37.2%;- 办公室与行政支持类在劳动力中占比最高(12.2%),对应的 AI 使用率为 7.9%。- 仅约 4% 的职业在至少 75% 的任务中使用 AI。- 约 36% 的职业在至少 25% 的任务中使用 AI。- 数据中未发现某个工作被完全自动化的证据——AI 更多是分散应用于各项任务,对不同任务组的影响存在差异。- 整合 O*NET 数据中的美国中位薪资信息后,发现:- 低薪和极高薪的工作均显示出极低的 AI 使用率(如洗发师、产科医生),- 中高薪职业(如程序员、文案撰稿人)则是 AI 使用最频繁的群体。年薪(x 轴)与 Claude 交谈中涉及该职业的百分比(y 轴)。图中突出显示了一些说明性职业。- **增强**:AI 与用户协作完成任务(57%);- **自动化**:AI 直接完成任务(43%)。- 增强型任务细分为:验证(2.8%)、任务迭代(31.3%)和学习(23.3%);- 自动化型任务细分为:反馈循环(14.8%)和指令式(27.8%)。与 Claude 的对话中涉及增强与自动化的百分比,以及每个类别中任务子类型的细分。我们论文中对子类型的定义如下。指令:以最少的交互完成任务委派;反馈循环:由环境反馈指导的任务完成;任务迭代:协作细化过程;学习:知识获取和理解;验证:工作验证和改进。本研究为观察 AI 如何改变劳动力市场提供了独特视角,但存在若干局限:- 无法确知使用 Claude 完成任务的用户是否出于工作需要;- 不清楚用户如何利用 Claude 的回复(例如是否复制代码或进行事实核查);- 分析仅基于 Claude.ai 免费和专业版数据,而非 API、团队或企业用户;- 由于任务种类繁多,Clio 可能对部分对话的分类存在错误;- Claude 无法生成图像,因此部分创意用途未能在数据中体现;- 编码相关应用可能在数据中被过度代表,因此数据样本不一定代表 AI 使用的整体情况。- 劳动力市场的格局可能在短期内发生显著变化,未来许多现有工作可能会逐步演变而非完全消失。- 我们将定期重复上述分析,以追踪未来可能出现的社会和经济变革,并定期发布相应研究成果及数据集,作为 Anthropic 经济指数的一部分。- 虽然研究展示了 AI 的应用数据,但未提供具体政策建议,未来的应对策略需结合证据、价值观和广泛经验。- 本报告及 Anthropic 经济指数的重要贡献在于其新方法论,提供了关于 AI 影响的详细数据。- 我们将公开共享本次分析使用的数据集,并计划在未来持续共享更多数据。- 完整数据集可供下载,同时也开放了供研究人员反馈意见和提出新研究方向的表单。感谢以下专家在早期发现和报告草稿阶段提供的富有成效的意见和讨论:- Jonathon Hazell, Anders Humlum, Molly Kinder, Anton Korinek, Benjamin Krause, Michael Kremer, John List, Ethan Mollick, Lilach Mollick, Arjun Ramani, Will Rinehart, Robert Seamans, Michael Webb, Chenzi Xu.以上文章中摘要部分由 deepseek 分析提供,中文翻译部分由 chatgpt 完成,本人只做了排版和贴图工作。
---
---
没有评论:
发表评论