当用户向AI语言模型提出问题时,有时AI给出的答案简直就是胡说八道,也叫“AI幻觉”。更加阴险的是,它还会编造出一大堆理由,让谎言听起来很有道理,这让人很难区分真假。
现在,英国牛津大学的科学家给出了一个识别AI谎言的方法,真正的是“用魔法打败魔法”,他们利用AI揭开AI的谎言。
科学家发现,如果反复向AI问同一个问题,且得到的答案每次都一致,这说明可信度较高,否则可信度较低。基于此,可以在现有AI模型中集成AI“警察”控制AI幻觉,目前而言很容易。不过,科学家称,该方法也有缺点,比如AI响应会被延迟,并带来高昂的计算成本。
另外,可能无法识别AI所有谎言。如果所有AI都联合起来坚持自己的谎言,一遍又一遍的重复答案,这时就无能为力了。
本文链接:http://www.mocany.com/showinfo-3-47747-0.html用魔法打败魔法 科学家用AI打败“AI幻觉”