自然语言处理:RAG

阅读量 ,评论量

背景

RAG

组成部分

1、文档检索

GraphRAG

GraphRAG相较RAG能额外带来的增益:

组成部分

0、图数据源(Datasources)

提升数据质量与相关性对 取得优异成果的重要性,甚至可能超过模型优化。

  1. 图的构建:
  2. 图的表示:

1、query预处理(Processor)

2、检索(Retriever)

  1. 基于启发式的检索:
  2. 基于学习的检索:
  3. 高级检索策略:

3、检索结果预处理(Organizer)

对检索内容进行处理和优化,使其更适合生成器使用,从而进一步提升下游内容生成质量。

  1. 图剪枝:
  2. 重排序:对检索的N条信息组装成prompt的先后顺序;(其价值受限于基座模型)
  3. 图增强:图结构增强、图特征增强,对检索到的结果做进一步扩展;
  4. 语言化:将检索到的三元组、路径或图转换为大语言模型可理解的自然语言。

4、汇总生成结果

  1. 基于判别的生成器:用于节点/边/图分类等任务
  2. 基于大语言模型的生成器:
  3. 基于图的生成器:用于分子生成等图生成相关的任务

图类型

规划与推理图

规划或推理图刻画了不同实体间固有的逻辑流程,其中实体通常代表具体规划或推理子步骤,边则表示它们的逻辑关系。

1、检索(Retriever)

其它