功能说明

对请求/返回中的敏感词拦截、替换

image

处理数据范围

  • openai协议:请求/返回对话内容
  • jsonpath:只处理指定字段
  • raw:整个请求/返回body

敏感词拦截

  • 处理数据范围中出现敏感词直接拦截,返回预设错误信息
  • 支持系统内置敏感词库和自定义敏感词

敏感词替换

  • 将请求数据中出现的敏感词替换为脱敏字符串,传递给后端服务。可保证敏感数据不出域
  • 部分脱敏数据在后端服务返回后可进行还原
  • 自定义规则支持标准正则和grok规则,替换字符串支持变量替换

运行属性

插件执行阶段:认证阶段 插件执行优先级:991

配置字段

名称数据类型默认值描述
deny_openaibooltrue对openai协议进行拦截
deny_jsonpathstring[]对指定jsonpath拦截
deny_rawboolfalse对原始body拦截
system_denyboolfalse开启内置拦截规则
deny_codeint200拦截时http状态码
deny_messagestring提问或回答中包含敏感词,已被屏蔽拦截时ai返回消息
deny_raw_messagestring{“errmsg”:“提问或回答中包含敏感词,已被屏蔽”}非openai拦截时返回内容
deny_content_typestringapplication/json非openai拦截时返回content_type头
deny_wordsarray of string[]自定义敏感词列表
replace_rolesarray-自定义敏感词正则替换
replace_roles.regexstring-规则正则(内置GROK规则)
replace_roles.type[replace, hash]-替换类型
replace_roles.restoreboolfalse是否恢复
replace_roles.valuestring-替换值(支持正则变量)

配置示例

  1. system_deny: true
  2. deny_openai: true
  3. deny_jsonpath:
  4. - $.messages[].content
  5. deny_raw: true
  6. deny_code: 200
  7. deny_message: “提问或回答中包含敏感词,已被屏蔽”
  8. deny_raw_message: “{\”errmsg\”:\”提问或回答中包含敏感词,已被屏蔽\”}”
  9. deny_content_type: application/json
  10. deny_words:
  11. - “自定义敏感词1
  12. - “自定义敏感词2
  13. replace_roles:
  14. - regex: “%{MOBILE}”
  15. type: replace
  16. value:
  17. # 手机号 13800138000 ->
  18. - regex: “%{EMAILLOCALPART}@%{HOSTNAME:domain}”
  19. type: replace
  20. restore: true
  21. value: @$domain
  22. # 电子邮箱 admin@gmail.com -> @gmail.com
  23. - regex: “%{IP}”
  24. type: replace
  25. restore: true
  26. value: “**...
  27. # ip 192.168.0.1 -> ...
  28. - regex: “%{IDCARD}”
  29. type: replace
  30. value: “*
  31. # 身份证号 110000000000000000 -> **
  32. - regex: sk-[0-9a-zA-Z]*”
  33. restore: true
  34. type: hash
  35. # hash sk-12345 -> 9cb495455da32f41567dab1d07f1973d
  36. # hash后的值提供给大模型,从大模型返回的数据中会将hash值还原为原始值

敏感词替换样例

用户请求内容

请将 curl http://172.20.5.14/api/openai/v1/chat/completions -H "Authorization: sk-12345" -H "Auth: test@gmail.com" 改成post方式

处理后请求大模型内容

curl http://***.***.***.***/api/openai/v1/chat/completions -H "Authorization: 48a7e98a91d93896d8dac522c5853948" -H "Auth: ****@gmail.com" 改成post方式

大模型返回内容

您想要将一个 curl 的 GET 请求转换为 POST 请求,并且这个请求是向一个特定的 API 发送数据。下面是修改后的 curl 命令,以 POST 方式发送:

  1. curl -X POST \
  2. -H Authorization: 48a7e98a91d93896d8dac522c5853948 \
  3. -H Auth: *@gmail.com \
  4. -H Content-Type: application/json \
  5. -d ‘{“key”:”value”}’ \
  6. http://...*/api/openai/v1/chat/completions

这里做了如下几个修改:

  • -X POST 设置请求方式为 POST。
  • -H "Content-Type: application/json" 设置请求头中的 Content-Typeapplication/json,这通常用来告诉服务器您发送的数据格式是 JSON。
  • -d '{"key":"value"}' 这里设置了要发送的数据,'{"key":"value"}' 是一个简单的 JSON 对象示例。您需要将其替换为您实际想要发送的数据。

请注意,您需要将 "key":"value" 替换为您实际要发送的数据内容。如果您的 API 接受不同的数据结构或者需要特定的字段,请根据实际情况调整这部分内容。

处理后返回用户内容

您想要将一个 curl 的 GET 请求转换为 POST 请求,并且这个请求是向一个特定的 API 发送数据。下面是修改后的 curl 命令,以 POST 方式发送:

  1. curl -X POST \
  2. -H Authorization: sk-12345 \
  3. -H Auth: test@gmail.com \
  4. -H Content-Type: application/json \
  5. -d ‘{“key”:”value”}’ \

这里做了如下几个修改:

  • -X POST 设置请求方式为 POST。
  • -H "Content-Type: application/json" 设置请求头中的 Content-Typeapplication/json,这通常用来告诉服务器您发送的数据格式是 JSON。
  • -d '{"key":"value"}' 这里设置了要发送的数据,'{"key":"value"}' 是一个简单的 JSON 对象示例。您需要将其替换为您实际想要发送的数据。

请注意,您需要将 "key":"value" 替换为您实际要发送的数据内容。如果您的 API 接受不同的数据结构或者需要特定的字段,请根据实际情况调整这部分内容。

相关说明