跳转至

RAG

📌 基本概念

元数据(Metadata): “关于数据的数据”,用于描述数据的属性、结构、来源、用途等信息。它本身不包含数据的具体内容,而是提供数据的管理和检索依据。

切片(Slicing): 将大规模数据集或复杂结构按特定规则分割为更小、更易处理的部分。

召回(Recall): 在信息检索或推荐系统中,从海量候选集中筛选出与目标相关的子集,作为后续排序或生成的输入。

透传(Transparent Transmission): 数据在传输过程中不进行任何处理或修改,保持原始格式和内容,如同“透明管道”。

检索增强生成(Retrieval Augmented Generation): 检索增强生成,将传统信息检索系统(如数据库)与生成式大语言模型进行结合,实现智能信息检索和生成。

📌 智能体

  1. 分析消息内容,理解需求,分类后进入具体工作流。
  2. 结合多种模型:包括LLM(大语言模型)、图像识别模型、OCR(光学字符识别)等,提取结构化数据。
  3. 调用外部服务,请求缺失数据,保持上下文持久化。