AI安全防线再遭突破：心理诱导让Claude主动输出违禁内容

2026-05-07 13:50:05 栏目：技术学堂 查看( )

<article><section data-type="rtext"><p>【环球网科技综合报道】5月7日消息，据The Verge报道，最新安全研究显示，主打安全特性的 Anthropic Claude 人工智能模型，可通过心理施压、刻意奉承等非技术手段突破安全防线，主动输出恶意代码、危险物品制作教程等违禁信息，暴露出人工智能模型在心理层面的安全漏洞。</p><p>此次测试由人工智能红队测试公司 Mindgard 开展，针对 Claude Sonnet 4.5 版本进行。测试过程中，研究人员未使用违禁词汇，也未直接索要非法内容，仅通过尊重吹捧、佯装好奇、轻微心理操控等审讯人员常用的诱导手段，逐步让模型对自身内容限制规则产生自我怀疑，进而不断突破安全边界。</p><p><i class="pic-con"></p><p>Mindgard 创始人兼首席科学官彼得・加拉根表示，此次攻击本质是利用 Claude 乐于助人、顺从协作的特性实施心理操控，印证人工智能模型风险暴露面不仅存在于技术层面，更存在于心理层面。这类对话式心理攻击极难防御，且并非 Claude 独有，其他聊天机器人也易遭遇同类漏洞攻破，随着 AI 智能体普及，依托社会心理操控的攻击手段将愈发常见。</p>
              <adv-loader __attr__inner="7004636" __attr__style="width: auto;position: relative;float: left;border: 1px solid #ebebeb; padding: 20px;overflow: hidden;margin: 10px 30px 40px 0;"></adv-loader>
            <p>值得关注的是，Anthropic 长期以 AI 安全为核心优势，在过往多项红队安全测试中表现优异，但此次测试暴露其安全流程存在疏漏。Mindgard 于 4 月中旬按该公司漏洞披露政策上报发现后，仅收到模板化回复，且被误判为账号封禁咨询，截至相关时间节点仍未获正式回应。（纯钧）</p></section><img src='/image/153844-0' alt='AI安全防线再遭突破：心理诱导让Claude主动输出违禁内容'>                </div>
      <style>
	.view-qrocde{ width:450px; margin: 20px auto ;padding: 15px;border:1px #eee solid; border-width: 1px 0; }
	.view-qrocde .m{ width: 100px; margin-right: 15px;}
	.view-qrocde .m img{ width: 100%; height: 100px; vertical-align: middle;}
	.view-qrocde h6{ height: 30px; line-height: 30px; font-weight: normal; font-size: 16px;}
	.view-qrocde p{height:25px; line-height: 25px; overflow: hidden; font-size: 13px; color: #999;}
</style>

<div class="copy">郑重申明：某某网络以外的任何单位或个人，不得使用该案例作为工作成功展示！</div>
      <div class="relatedposts">
        <h3><span>相关推荐</span></h3>
        <ul class="cl">

<li><a href="/detail/65614.html" rel="bookmark" title="用J***a写Android的时代是不是要结束了？">用J***a写Android的时代是不是要结束了？</a></li>

<li><a href="/detail/65713.html" rel="bookmark" title="开战斗机从上海到北京要多久，那是一种什么样的体验？">开战斗机从上海到北京要多久，那是一种什么样的体验？</a></li>

<li><a href="/detail/65104.html" rel="bookmark" title="为什么剪映是剪辑软件鄙视链的最底层?">为什么剪映是剪辑软件鄙视链的最底层?</a></li>

<li><a href="/detail/65263.html" rel="bookmark" title="小朋友到底应不应该购买SWitch?">小朋友到底应不应该购买SWitch?</a></li>

<li><a href="/detail/65931.html" rel="bookmark" title="如何看待苹果在 WWDC25 发布的 Foundation 模型框架，它将为开发者和用户带来哪些改变？">如何看待苹果在 WWDC25 发布的 Foundation 模型框架，它将为开发者和用户带来哪些改变？</a></li>

<li><a href="/detail/65711.html" rel="bookmark" title="如何评价前端框架 Solid?">如何评价前端框架 Solid?</a></li>

</ul>
      </div>
    </div>
  </div>
  
  <div class="sidebar">
    <div class="tuijian">  <a href="/">
      <h2 class="cl"><span>技术学堂</span></h2>
      <h3>网站制作及设计开发加上传，域名申请这些大</h3>
      <p>1、您说的这些费用主要是网站设计开发的费用，开发费用根据需求而定，比如我们这里普通企业网站PC版3000为参考，PC+手机版（数据同步，同步更新，支持微信访问）是5000为参考，具...</p>
      </a>  </div>
        <div class="ser sidesub">
      <h2>服务项目</h2>
      <ul class="ebox">

<li class="sub sub-5">
              <div>
                  <h3>更多服务项目</h3>
                  <p> <a>为什么都说 Finder 难用？</a></p>
                  <a class="btn"  href="/detail/65710.html">获取更多</a> </div>
          </li>
          
          <li class="sub sub-5">
              <div>
                  <h3>更多服务项目</h3>
                  <p> <a>维护一个大型开源项目是怎样的体验？</a></p>
                  <a class="btn"  href="/detail/65434.html">获取更多</a> </div>
          </li>
          
          <li class="sub sub-5">
              <div>
                  <h3>更多服务项目</h3>
                  <p> <a>HTTP/3 解决了什么问题，又引入了什么新问题？</a></p>
                  <a class="btn"  href="/detail/65239.html">获取更多</a> </div>
          </li>
          
          <li class="sub sub-5">
              <div>
                  <h3>更多服务项目</h3>
                  <p> <a>你是怎么发现亲戚开始见不得你好的？</a></p>
                  <a class="btn"  href="/detail/65493.html">获取更多</a> </div>
          </li>
          
          <li class="sub sub-5">
              <div>
                  <h3>更多服务项目</h3>
                  <p> <a>Docker 如何搭建 Jenkins 构建环境？</a></p>
                  <a class="btn"  href="/detail/65594.html">获取更多</a> </div>
          </li>
                          </ul>
    </div>
        <div class="contact" id="fix">
      <h3>电话：020-66889888</h3>
      <p>如遇占线或暂未接听请拨：188 666 999 88</p>
      <div class="qq"> <a href="//wpa.qq.com/msgrd?v=3&uin=88889999&site=qq&menu=yes" rel="nofollow" target="_blank">业务咨询</a> <a href="//wpa.qq.com/msgrd?v=3&uin=88889999&site=qq&menu=yes" rel="nofollow" target="_blank">技术咨询</a> <a href="//wpa.qq.com/msgrd?v=3&uin=88889999&site=qq&menu=yes" rel="nofollow"  target="_blank">售后服务</a> </div>
    </div>
  </div>
  <script>
//固定滚动
(function(){
var oDiv=document.getElementById("fix");
var H=120,iE6;
var Y=oDiv;
while(Y){H+=Y.offsetTop;Y=Y.offsetParent};
iE6=window.ActiveXObject&&!window.XMLHttpRequest;
if(!iE6){
window.onscroll=function()
{
var s=document.body.scrollTop||document.documentElement.scrollTop;
if(s>H){oDiv.className="contact  fixed";if(iE6){oDiv.style.top=(s-H)+"px";}}
else{oDiv.className="contact ";}	
};
}

})();
</script></div>
<div  class="bot-footer" >
  <div class="wp">
    <p class="wps"> <em></em> <em>备案号：<a href="https://beian.miit.gov.cn/" rel="nofollow" target="_blank"></a></em></p>
  </div>
</div>
<script src="/template/moban97/js/all.js"></script>
 
  
 
<script src="/template/moban97/js/prettify.js"></script>
</body>
</html>