关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家437人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

9月重夺销冠,这次上汽赢在内功

网易汽车 浏览 805

安琪酵母投15亿元补产能缺口

北京商报 浏览 272

美军在加勒比地区袭击船只致6人死亡 包括两名特多公民

环球网资讯 浏览 776

聊聊全新奥迪A6L 也许豪华行政市场要换风向了

网易汽车 浏览 797

孙怡恋情风波升级,被质疑 “知三当三 ”黑料被扒

叶公子 浏览 14549

不敌王楚钦,松岛辉空:满脑子只有不甘心,混双应该能复仇

懂球帝 浏览 44

韩国知名潮牌宣布将关闭中国全部门店 陆续打折清仓

潇湘晨报 浏览 2186

推广 || 断舍离N次也不会断了它,买过最值的冬日单品之一

黎贝卡的异想世界 浏览 460

今年冬天一定要拥有这4件“大衣服”,松弛又好看!

LinkFashion 浏览 135

叔叔宗泽后再发声:娃哈哈不是宗家的 水军害了宗馥莉

第一财经资讯 浏览 4040

夏天的阔腿裤,“大一号”更时髦!

LinkFashion 浏览 12644

刚刚,阿里千问 APP 开启公测,要做中国版ChatGPT | 附实测

爱范儿 浏览 316

俄称在红军城打击被围困的乌军 乌称击退俄军进攻

环球网资讯 浏览 470

4年“伺候”4位总经理,水井坊公关一号位挂印封金

财经众议院 浏览 119

冲着唐嫣去看《爱情没有神话》,却被演反派的冯绍峰吸引了

温柔娱公子 浏览 725

俄方表示结束乌克兰危机“欧洲方案”不具建设性

环球网资讯 浏览 261

王心凌再回应与吴克群绯闻

半岛晨报 浏览 390

编码新未来!WAVE2025泛互全球领航者大会即将启幕

霞光社 浏览 784

隐退4年后,张一鸣久违现身!互联网大佬正集体杀回

深蓝财经 浏览 829

一滴水循环使用3.5次,台积电回应南科厂水情吃紧:营运未受影响

IT之家 浏览 14333

天津买家买下大型豪华邮轮 花数千万元请80名工人翻新

都市快报橙柿互动 浏览 57145
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1