RAG
📌 基本概念
元数据(Metadata): “关于数据的数据”,用于描述数据的属性、结构、来源、用途等信息。它本身不包含数据的具体内容,而是提供数据的管理和检索依据。
切片(Slicing): 将大规模数据集或复杂结构按特定规则分割为更小、更易处理的部分。
召回(Recall): 在信息检索或推荐系统中,从海量候选集中筛选出与目标相关的子集,作为后续排序或生成的输入。
透传(Transparent Transmission): 数据在传输过程中不进行任何处理或修改,保持原始格式和内容,如同“透明管道”。
检索增强生成(Retrieval Augmented Generation): 检索增强生成,将传统信息检索系统(如数据库)与生成式大语言模型进行结合,实现智能信息检索和生成。
📌 智能体
- 分析消息内容,理解需求,分类后进入具体工作流。
- 结合多种模型:包括LLM(大语言模型)、图像识别模型、OCR(光学字符识别)等,提取结构化数据。
- 调用外部服务,请求缺失数据,保持上下文持久化。