大模型笔记:幻觉 hallucination
温馨提示:这篇文章已超过379天没有更新,请注意相关的内容是否还可用!
1 介绍
- “幻觉” (Hallucination),指模型生成自然流畅,语法正确但实际上毫无意义且包含虚假信息即事实错误的文本,以假乱真,就像人产生的幻觉一样。
举个例子就是,即使现在的chatgpt-4,你问他一些有确切答案的问题,他也会“说胡话”
看起来语法语义上没什么问题,但那个赛季上港是21胜5平4负积68分(数据来自懂球帝)
2 幻觉分类
- 内部幻觉 (intrinsic hallucination)
- 生成的文本与给定源文本出现不忠实 (unfaithfulness) 或不一致 (inconsistency) 的现象
- 常见于文本摘要任务中,生成的摘要与原文不一致
- 外部幻觉 (extrinsic hallucination)
- 生成内容在源文本中并未提及,虽然不能找出相关证据,但也不能断言这就是错误的
3 幻觉的成因
- 生成的文本 𝑌 由源文本 𝑋 和语言模型里的先验知识 𝐾 共同决定
- 由于一般认为给定的源文本都是事实正确的 ground-truth,所以出现的幻觉一般都会归结于语言模型本身包含了错误事实。
- 语言模型中的先验知识都来自于训练语料,用于训练语言模型的大数据语料库在收集时难免会包含一些错误的信息
- 这些错误知识都会被学习,存储在模型参数中
- 模型生成文本时会优先考虑自身参数化的知识,所以更倾向生成幻觉内容
- 由于一般认为给定的源文本都是事实正确的 ground-truth,所以出现的幻觉一般都会归结于语言模型本身包含了错误事实。
- 另一方面,模型训练和推理时的差异,也是导致推理时更容易生成幻觉的原因之一
- 训练通常是teacher forcing,以 ground-truth 作为后续预测 token 的前缀输入
- 机器学习笔记:RNN值Teacher Forcing_teach learning rnn-CSDN博客
- 推理则根据历史序列生成来预测下一个 token
4 不一致性(inconsistency)的分类
“不一致” (inconsistency)——用来描述这些文本生成的幻觉问题的另一个更常见的术语
- 模型自身不一致 (self-inconsistency)
- 模型生成的回复与对话历史或与自身已生成回复相矛盾(内部幻觉)
- 与对话历史的不一致性问题一般来自于历史信息的遗忘,包含与已生成文本相矛盾
- 这是人设 (persona) 对话中常见的问题
- 赋予系统一个固定角色,在聊天过程中模型的人设信息会发生变化
- 与对话历史的不一致性问题一般来自于历史信息的遗忘,包含与已生成文本相矛盾
- 模型生成的回复与对话历史或与自身已生成回复相矛盾(内部幻觉)
- 外部不一致 (external inconsistency)
- 对话系统为了生成角色一致且信息丰富的回复,会将包含显式角色信息的外部数据引入系统以辅助模型生成
5 幻觉的评估
5.1 统计的方法
- 直接计算生成文本和参考目标文本之间的词汇匹配度
- ROUGE
- BLEU
- 精确率&召回率。。。
5.1.1 缺点
- 大模型的回复往往不唯一,输入与输出是一对多的映射
- 在实际应用中,覆盖所有可能的输出几乎不可能
5.2 基于模型方法的评估
- 主要基于自然语言推理 (Natural Language Inference, NLI)
- 即判断一项假设(生成文本)是否蕴含于前提(参考文本)
- 基于 NLI 的指标将幻觉分数定义为源文本与生成文本之间的蕴含概率
- 需要先收集相关蕴含关系的数据集来训练这样一个判别模型
5.2.1 缺点
基于模型的评估方法整体上比词级别的统计方法要适用得多,然而文本蕴含模型只能返回一个分数,无法定位具体生成文本的哪些部分是错误的
- 主要基于自然语言推理 (Natural Language Inference, NLI)
- 训练通常是teacher forcing,以 ground-truth 作为后续预测 token 的前缀输入
- 内部幻觉 (intrinsic hallucination)
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度,360,搜狗等多加搜索引擎自动关键词搜索配图,如有侵权的图片,请第一时间联系我们,邮箱:ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!



