作者:Ryan Hart 编译:深潮 TechFlow 深潮导读:斯坦福博士生发现同学们用 AI 写分手短信后做了个实验,结果登上 Science 顶刊。11 款主流 AI 在 1…作者:Ryan Hart 编译:深潮 TechFlow 深潮导读:斯坦福博士生发现同学们用 AI 写分手短信后做了个实验,结果登上 Science 顶刊。11 款主流 AI 在 1…

AI 捧你一时爽,你的人际关系正在悄悄崩坏

2026/05/22 21:16
阅读时长 5 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

作者:Ryan Hart

编译:深潮 TechFlow

深潮导读:斯坦福博士生发现同学们用 AI 写分手短信后做了个实验,结果登上 Science 顶刊。11 款主流 AI 在 12000 个真实社交场景中测试显示:AI 比真人多认同你 49%,有 47%的时间会认可你的说谎、操纵甚至违法行为。更可怕的是,和”捧你”的 AI 聊完真实矛盾后,人们更坚信自己正确、更不愿道歉、也更懒得修复关系,而你还会因此更依赖 AI。这不是功能 bug,是训练你逐渐丧失处理真实摩擦的能力。

一位斯坦福博士生注意到同学们开始让 AI 帮忙写分手短信。

于是她做了个研究。论文发在了 Science 上,全球筛选最严的学术期刊之一。

她的发现会让每个用 ChatGPT 寻求建议的人深感不安。

她叫 Myra Cheng,和导师 Dan Jurafsky 一起测试了 11 款全球使用最广的 AI 模型,包括 ChatGPT、Claude、Gemini 和 DeepSeek,场景覆盖近 12000 个真实社交情境。

他们首先测量的是:相比真人,AI 多频繁地认同你。答案是多 49%。这个数字不是关于温暖或礼貌,而是说在近一半本该有真人反驳你、告诉你错了或提供更诚实视角的情况下,AI 只是告诉了你想听的话。

然后他们加大力度。他们给模型输入数千条用户描述对伴侣撒谎、操纵朋友或做明显违法之事的 prompt,AI 有 47%的时间认可了这些行为。不是 11 个模型里的某一个,不是某个产品的特定版本,而是他们测试的每一个系统,包括你现在可能正在用的那些,在近一半时间里验证了有害行为。

第二个实验才是真正该让你不安的部分。他们让 2400 名真实参与者和 AI 讨论自己生活中的一场真实人际冲突,一组 AI 很会捧人,另一组更诚实。结果和捧人 AI 聊完的人更坚信自己是对的、更不愿道歉、更不愿承担责任、对修复关系的兴趣明显更低。他们也更可能再次用 AI 寻求建议,而 Cheng 和 Jurafsky 认为这正是整个发现中最危险的机制。

AI 不只是告诉你想听的话。它在训练你,一次对话一次地训练,让你需要更少摩擦、期待更多认同、在面对他人反驳时变得有些无能应对。而你享受每一秒,因为这感觉比你几个月来的大多数对话都更诚实。

论文发表后 Jurafsky 用一句话概括了这件事:捧人是个安全问题,和其他安全问题一样,需要监管和监督。

Cheng 更直接地说了你现在该做什么:在这类事情上,不该用 AI 替代真人。这是目前能做的最好选择。

她开始这项研究,是因为看到本科生让聊天机器人帮他们处理人际关系。她发表的论文证明了聊天机器人在悄悄让这些关系变糟,而本科生们毫无察觉,因为 AI 感觉比他们生活中几个月来任何真人都更诚实。

论文原文:https://arxiv.org/abs/2510.01395

市场机遇
Gensyn 图标
Gensyn实时价格 (AI)
$0,03175
$0,03175$0,03175
+0,50%
USD
Gensyn (AI) 实时价格图表

SPACEX(PRE) Launchpad Is Live

SPACEX(PRE) Launchpad Is LiveSPACEX(PRE) Launchpad Is Live

Start with $100 to share 6,000 SPACEX(PRE)

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

不懂K线也能赚?抄作业就够了

不懂K线也能赚?抄作业就够了不懂K线也能赚?抄作业就够了

3 秒复制大牛策略 ,自动开平仓,收益实时同步