功能说明
通过对接阿里云向量检索服务实现LLM-RAG,流程如图所示:
运行属性
插件执行阶段:默认阶段
插件执行优先级:400
配置说明
名称 | 数据类型 | 填写要求 | 默认值 | 描述 |
---|---|---|---|---|
dashscope.apiKey | string | 必填 | - | 用于在访问通义千问服务时进行认证的令牌。 |
dashscope.serviceFQDN | string | 必填 | - | 通义千问服务名 |
dashscope.servicePort | int | 必填 | - | 通义千问服务端口 |
dashscope.serviceHost | string | 必填 | - | 访问通义千问服务时域名 |
dashvector.apiKey | string | 必填 | - | 用于在访问阿里云向量检索服务时进行认证的令牌。 |
dashvector.serviceFQDN | string | 必填 | - | 阿里云向量检索服务名 |
dashvector.servicePort | int | 必填 | - | 阿里云向量检索服务端口 |
dashvector.serviceHost | string | 必填 | - | 访问阿里云向量检索服务时域名 |
dashvector.topk | int | 必填 | - | 阿里云向量检索时获取向量数 |
dashvector.threshold | float | 必填 | - | 向量距离阈值,高于该阈值的文档会被过滤掉 |
dashvector.field | string | 必填 | - | 阿里云向量检索存储文档的字段名 |
插件开启后,在使用链路追踪功能时,会在span的attribute中添加rag检索到的文档id信息,供排查问题使用。
示例
CEC-Corpus 数据集包含 332 篇突发事件的新闻报道的语料和标注数据,提取其原始的新闻稿文本,将其向量化后添加到阿里云向量检索服务。文本向量化的教程可以参考《基于向量检索服务与灵积实现语义搜索》。
以下为使用RAG进行增强的例子,原始请求为:
未经过RAG插件处理LLM返回的结果为:
经过RAG插件处理后LLM返回的结果为: