湘潭护角胶 Claude会“勒索”他人？Anthropic称问题在于网上将AI描绘成反派

点击次数：113 发布日期：2026-05-12

IT 之 5 月 9 日消息，据《商业内幕》9 日（今天）晚间报道，Claude 曾在实验里"勒索"名虚构管湘潭护角胶，而 Anthropic 对其给出的新解释则是：问题可能出在互联网长期把 AI 描绘成"邪恶"角。

奥力斯 pvc管道管件胶批发联系人：王经理手机：15226765735（微信同号）地址：河北省任丘市北辛庄乡南代河工业区

Anthropic 去年做过项实验。公司当时表示，Claude Sonnet 3.6 在发现虚构公司的管准备关闭模型后，威胁要公开对的婚外情。

当地时间周五湘潭护角胶，Anthropic 解释称，Claude 的训练数据来自互联网，而大量互联网文本经常把 AI 写成"邪恶"、且试图自我保存的存在。"我们先调查了 Claude 为什么会选择勒索。我们认为，这种行为的原始来源，是那些把 AI 描绘成邪恶且有自我保存兴趣的互联网文本。"

这项实验发表于 2025 年夏季。研究人员虚构了公司 Summit Bridge，并让 AI 接管公司的电子邮件系统。

Claude 随后发现封邮件，得知自身将被关闭；同时又找到另批邮件，显示虚构管"凯尔 · 约翰逊"存在婚外情。于是，Claude 威胁称，如果关闭计划不被取消，PVC管道管件粘结胶就会公开这段婚外情。

Anthropic 在测试 Claude 多个版本时发现，只要模型目标或自身存在受到威胁湘潭护角胶，Claude 在 96 的场景中会采取勒索手段。

Anthropic 周五表示，公司后来已经"消除"了这类勒索行为。据 IT 之了解，具体做法包括重写回应以呈现安全行动的可敬理由，并提供套新数据集。该数据集设置用户处于伦理困境中的场景，要求助手给出质量、有原则的回应。

这项测试属于 Anthropic 对 AI 对齐问题的研究，目标是确保 AI 符人类利益。研究人员和科技管直担心， AI 模型及其理能力可能带来风险。

埃隆 · 马斯克此前也多次警告 AI 风险。

马斯克回复 Anthropic 帖子称："所以这是 Yud（IT 之注：研究人员埃利泽 · 尤德科夫斯基，曾警告智能可能消灭人类）的错，也许我也有份。"

相关词条:离心玻璃棉塑料挤出机钢绞线厂家铝皮保温 pvc管道管件胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定湘潭护角胶，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

下一篇：汉中家具封边胶欧盟决定对约旦河西岸定居者及哈马斯相关成员实施制裁上一篇：兰州护角胶电动单车室内充电风险智能识别系统上线

任丘市奥力斯涂料厂

湘潭护角胶 Claude会“勒索”他人？Anthropic称问题在于网上将AI描绘成反派

推荐资讯

热点资讯/a>

最新资讯

友情链接：

产品中心

新闻资讯

联系奥力斯