关闭广告

AI狂热不敌冷峻现实:企业下调AI代理预期,实现全自动化仍需数年时间

华尔街见闻官方481人阅读

媒体报道,AI通过通用型聊天机器人和AI编程工具正在改变人们的工作方式,为OpenAI和微软等公司的收入带来增长,各家公司一直在尝试把员工的工作内容交给人工智能代理(AI agents)。

然而,许多企业在使用更复杂的AI代理时却遇到了困难,这些代理往往“胜任不了工作”,因此AI提供商不得不亲自介入、与客户一起排查问题,避免AI“搞砸事情”。

例如,欧洲零售商Fnac在使用AI客服代理时遇到困难。Fnac曾测试过OpenAI、Google和其他实验室的模型,但效果不佳。该公司首席数字与电商负责人Olivier Theulle对媒体表示,可靠性是个问题:当顾客反馈产品有缺陷时,AI要求顾客提供产品序列号,但却把这些序列号与其他产品的序列号混淆了,而这些序列号仅有一位数字不同。

Fnac每年营收达100亿美元。Theulle说,直到与以色列公司AI21 Labs达成合作,并获得其工程师的协助后,这个AI代理的表现才开始变得稳定。AI21联合CEO Ori Goshen说,

“问题在于,模型开箱即用时在各类基准测试上表现很好,但在真实企业环境中表现并不好。”
“需要进行相当程度的定制化。”

一些公司对媒体表示,只有在自家软件工程师花上数月时间部署AI代理,并从AI公司那里获得直接技术支持后,他们才能真正从中受益。如今,科技公司领导者也表示,企业不能指望在没有AI厂商“手把手扶持”的情况下,让复杂AI项目顺利运行。

风投Vinod Khosla在10月接受媒体采访时表示,

“这就像说‘我们有辆赛车,任何人都能开’,但普通人根本无法发挥赛车的最大性能。”

Khosla是OpenAI的早期投资者,最近又投资了一家AI咨询初创公司,该公司向T-Mobile等企业派驻工程师,帮助他们在大型组织内落地AI。这家初创公司Distyl只是众多在该领域崛起的公司之一,它们为需要支持的企业提供高科技咨询服务。OpenAI、Anthropic、Salesforce和Snowflake等AI开发商和AI代理提供商也开始招聘前线部署工程师(FDEs)或推出类似咨询服务,但这往往会提高他们的成本。

另一个例子则是专为汽车经销商提供软件、年销售额90亿美元的Cox Automotive。此前该公司开发一个AI代理,用于为经销商制作营销网页。由于该公司是亚马逊云服务AWS在汽车领域的最大客户之一,所以得到了“白手套式的服务”。

Cox首席产品官Marianne Johnson对媒体表示,AWS工程师和为该代理提供AI技术的Anthropic工程师飞到Cox位于亚特兰大的总部,与Cox的软件开发人员并肩工作了数天共同构建这个工具。她拒绝透露Cox为此向AWS和Anthropic支付了多少费用,但估计未来数年可节省数百万美元的人力成本,因为公司无需再人工为客户制作网站。

“它很自信地胡说八道”

AI代理的目标是处理客户服务问题、管理IT系统等各种任务。AI和云服务提供商正在押注企业使用AI代理带来的收入,将其作为未来一两年投入数千亿美元建设AI数据中心的理由。

但这些供应商以及部分客户高管表示,AI代理太难配置,而且行为常常不可预测。这使得它们无法用于那些一旦出错就会造成严重后果的任务。因此客户降低了预期,不再奢望AI代理能自动化太多工作,并暂缓在客户支持和网络安全等关键岗位部署AI代理。

例如,IT服务巨头Kyndryl今年开始测试微软的Security Copilot,这是一款聊天机器人,旨在对接企业IT系统,用简单英语解释潜在安全漏洞,相当于自动化网络安全分析师的工作。但负责公司内部网络安全的Scott Owenby对媒体表示,当Kyndryl员工尝试询问一些基础问题,比如“哪些公司设备运行的是过期软件”时,Security Copilot给出的答案明显是错误的。Owenby说,

“它信心满满地胡说八道,而我佩服这种自信,但我无法相信它的数据。”

Kyndryl花了约5万美元测试了Security Copilot六个月,之后决定停止使用这款软件。Owenby说,

“我基本上是把5万美元烧了。这不算多,如果哪怕有一点用我们都会继续用,但我们没想到它居然完全没法用。”

Owenby还说,其他AI工具效果更好,例如Palo Alto Networks的软件可以自动处理网络安全中重复繁琐的工作,例如调查员工从新地点登录或截取敏感数据截图的情况。这使得他过去一年减少了部分安全团队的人手,但他表示仍然需要工作人员监控这些AI工具,而不能完全让AI全权执行。

“有些炒作成分”

博世电动工具(Bosch Power Tools)年营收超57亿美元。该公司数字客户体验负责人Florian Haustein对媒体表示,公司一年多以来一直在测试一款聊天机器人,用于回答客户关于工具使用方式和故障排查的问题。

但Haustein表示,这款聊天机器人仍然经常给出错误答案,一些错误答案甚至可能导致用户受伤。因此,该项目仍停留在试点阶段。他还表示,博世正在测试Google、OpenAI等多家实验室的模型。

Haustein对媒体说,博世在另一个不那么激进的客服聊天机器人上收效更好,该机器人只回答更基础的问题,例如在哪可以买到某款产品;还有一款由SAP提供的AI工具能读取客户咨询内容,并自动分配给合适的人类员工。Haustein说,

“我认为‘完全用AI做客服’有些炒作。”
“你必须确保答案接近100%准确……但我们仍然看到幻觉和错误答案。我认为我们还没有达到能够完全自动化所需要的信心水平。”

一些技术供应商也承认AI代理还未成熟。亚马逊CEO Andy Jassy在上周四的财报电话会上说:

“现阶段,构建AI代理仍比想象中困难。”
“但随着时间推移,企业从AI中实现的很多价值将来自AI代理。”
AI代理产品收入难计算

目前,通用聊天机器人、编程助手、AI搜索和AI视频生成工具的采用,已经帮助工程、市场和产品管理团队提升了效率,企业高管们对媒体表示。

这推动了AI供应商的新收入增长:根据媒体的生成式AI数据库,由OpenAI和Anthropic引领的20家AI原生初创公司,每年因AI办公用途获得的年化收入已达230亿美元,而三年前几乎为零。

但要单独计算“AI代理”带来的收入却很困难。在Google、微软和亚马逊等云公司,大部分收入增长来自OpenAI、Anthropic和Meta等大型AI开发商租用服务器,而非企业类AI应用。

在出售AI代理的企业软件公司中,结果不一。Salesforce今年早些时候表示,其Agentforce产品(用于自动化销售邮件、跟踪发票等任务)年收入超过1亿美元。ServiceNow则称,其用于自动处理IT服务工单的AI软件,有望在2026年底前实现10亿美元收入。但这两家公司的收入增长最近几个季度都比2023年大多数时间慢。

SAP尚未单独公布AI产品收入,但CEO Christian Klein在本月的财报电话中表示,AI将在未来两年带来“双位数收入增长”。

许多提供AI代理的软件公司,包括Salesforce、Snowflake和Xero,目前甚至没有对这类产品收费,他们希望等客户真正认可价值之后再收费。

ServiceNow全球客户运营总裁Paul Fipps对媒体表示,近期客户在试点AI功能方面不再那么兴奋,因为他们变得更加现实,开始考虑AI代理究竟能合理自动化哪些任务。Fipps说,

“在过去12到18个月里,由于生成式AI的发展速度太快,很多客户积极试点这些AI能力,钟摆被推到了极端的一侧。”
“现在你看到钟摆开始回摆。”

他仍然乐观,认为随着AI代理不断进步,未来几年企业会继续大力投入。

目前,AI代理在软件开发领域最成功。AI编程代理正成为许多公司工程团队的标配。但软件工程师仍需检查AI的代码,因为AI会犯错,意味着任务还不能完全自动化。

“保持现实”

Palo Alto Networks首席执行官Nikesh Arora表示,销售AI工具的公司必须谨慎,不要过度承诺AI能自动化多少工作。他认为,网络安全岗位要实现完全自动化仍需数年。

“我们保持现实的态度,(完全自动化)需要更多努力,我们必须非常确定,当把操作交给AI时,它采取的行动是正确的,因为网络安全是有后果的。”

尽管如此,公司仍然认可AI代理带来的收益,即使需要“有人看着”。例如,加拿大太阳马戏团Cirque du Soleil正在使用SAP提供的一款AI代理,追踪其服装和舞台布景供应商的发票。

当供应商发邮件询问发票状态时,AI代理会检查SAP系统中发票是否处理完毕,并草拟回复邮件。过去,该公司有两名全职员工做这件事;现在,这两人已被安排到其他部门,只需一人审核AI草稿再发出即可。

该工具的运营成本低于一名全职员工的薪资,副总裁Philippe Lalumière对媒体说:

“有时候AI写的邮件不太礼貌,但供应商得到回复更快、更清楚,所以整体满意度更高。我们没有因为它裁员,但生产力提升很明显。”

与此同时,其他AI代理供应商也提醒客户,要把这些工具视为实验性项目,而不是能立即带来回报的投资。

微软核心AI产品开发总裁Asha Sharma上周在The Information的WTF峰会上表示:

“把AI代理视为研发预算……一种将在未来5到10年见效的投资。”
“我认为我们还处在非常早期阶段……我们现在有数百万个AI代理投入生产使用,但大家仍然在摸索如何让AI代理真正有用。”
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五名学生相约看海被大浪卷入海中 两人获救三人失联

极目新闻 浏览 217929

懒理风波!小S携全家疑来厦门旅游 老公许雅钧也在

扒虾侃娱 浏览 13529

英特尔CEO预测个人电脑市场趋势:下半年将持续复苏

手机中国 浏览 13093

西热:大家现在对脏活累活不重视 都想去进攻去得分 谁都赢不了球

直播吧 浏览 15248

2000多年楚王大墓被盗 "摸金校尉"在村里租房3年寻墓

上游新闻 浏览 2821

欧洲航天局:中欧合作“微笑”卫星将于明年 4 月至 5 月发射

IT之家 浏览 618

马绩效:尤文对皇马机会多但把握差,很难说这就是积极的表现

懂球帝 浏览 662

齐溪高龄追生儿子 再婚王传君生俩女儿

萌神木木 浏览 848

VOGUE热捧刘亦菲被反噬,20周年众多大咖不出席,场面太尴尬!

萌神木木 浏览 639

以后请叫甄子丹为超级丹

港剧叔 浏览 873

巴以冲突两周年 加沙“仿佛已从地图上被抹去”

环球网资讯 浏览 891

告别奥博穆时代,保时捷加速落子研发"中国棋"

网易汽车 浏览 396

倪妮告秦雯和王家卫!?

八卦疯叔 浏览 496

遇到家境好的领导是什么体验?

识局 浏览 619

A股公司老总被抓宣布离婚 80后前妻分9.24亿紧急接班

每日经济新闻 浏览 1947

交通标志设置不合理致5814次"被违章" 当地:重新设置

封面新闻 浏览 3384

大瓜!虞书欣吴建豪恋情疑曝光,两人行程太一致

叶公子 浏览 17687

删繁就简,重构高级定制意义的Valentino

VOGUE中国 浏览 12665

仅播2集就口碑大爆,收视率破1.2,这才是国产都市剧该有的样子!

娱乐圈笔娱君 浏览 737

首负日本!巴西遭36年之耻 安帅气炸直接离场+判头号罪人“死刑”

风过乡 浏览 757

伊姐周六热推:电视剧《四喜》;电视剧《唐朝诡事录之长安》......

伊周潮流 浏览 467
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1