问答及生成 RAG
小艾同学 ... 大约 2 分钟
# 问答及生成 RAG
# RAG 概念
RAG 是 Retrieval-Augmented Generation(检索增强生成)的缩写,是人工智能和自然语言处理(NLP)领域的一种技术框架,主要用于提升生成式模型(如大语言模型)的准确性和可靠性。
检索(Retrieval)
在生成回答之前,系统会先从外部知识库(如数据库、文档或网页)中检索与输入问题相关的信息片段,确保生成内容基于最新或特定领域的权威数据。增强(Augmented)
将检索到的信息与模型的内部知识结合,作为生成答案的上下文,弥补纯生成模型可能存在的知识过时或幻觉(编造事实)问题。生成(Generation)
模型基于检索到的信息和自身训练数据,生成更准确、可靠的回答。
# 访答 RAG
目前,网上上的大模型 deepseek
、qwen
等大多都只支持网络知识问答,
访答知识库
会将知识库内相似的、相关的文件内容,作为知识,传递给问答大模型 deepseek
、qwen
,
从而,使大模型能够跟据知识库中的知识进行问答。
并且,访答
在知识库问答的基础上,还可以依据用户输入,生成相关的图片
、视频
、音频
等
# 优势
减少幻觉:依赖外部数据源,降低模型虚构事实的概率。
动态更新知识:无需重新训练模型,通过更新检索库即可获取最新信息。
可解释性:可追溯生成答案的参考来源,增强可信度。
# 应用场景
问答系统(如客服、知识库)
内容创作(辅助写作、报告生成)
医疗、法律等专业领域咨询
# 示例
若用户问“最新的COVID-19治疗方案是什么?”,RAG会先检索权威医学数据库的最新研究,再生成回答,而非仅依赖模型训练时的旧数据。
简单来说,RAG 是让AI先查资料再回答的技术,结合了检索的精准性和生成的灵活性。