抽取函数

selector

参数名描述可否为空
htmlhtml内容如resp.html
csscss选择器
类型text/attr/outerhtml
属性名当类型为attr时,填写此项

返回值类型:String

采用css选择器方法抽取一条数据

  • 获取第一个a标签的html
  1. ${extract.selector(resp.html,'a')}
  • 获取第一个a标签的text(文本)
  1. ${extract.selector(resp.html,'a','text')}
  • 获取第一个a标签的outerhtml
  1. ${extract.selector(resp.html,'a','outerhtml')}
  • 获取第一个a标签的href属性
  1. ${extract.selector(resp.html,'a','attr','href')}

selectors

参数名描述可否为空
htmlhtml内容如resp.html
csscss选择器
类型text/attr/outerhtml
属性名当类型为attr时,填写此项

返回值类型:List<String>

采用css选择器方法抽取一组数据

  • 获取所有a标签的html
  1. ${extract.selectors(resp.html,'a')}
  • 获取所有a标签的text(文本)
  1. ${extract.selectors(resp.html,'a','text')}
  • 获取所有a标签的outerhtml
  1. ${extract.selectors(resp.html,'a','outerhtml')}
  • 获取所有a标签的href属性
  1. ${extract.selectors(resp.html,'a','attr','href')}

xpath

参数名描述可否为空
htmlhtml内容如resp.html
xpathxpath表达式

返回值类型:String

采用xpath方法抽取一条数据

  • 获取第一个a标签的html
  1. ${extract.xpath(resp.html,'//a')}
  • 获取第一个a标签的href属性
  1. ${extract.xpath(resp.html,'//a/@href')}

xpaths

参数名描述可否为空
htmlhtml内容如resp.html
xpathxpath表达式

返回值类型:List<String>

采用xpath方法抽取一组数据

  • 获取所有a标签
  1. ${extract.xpaths(resp.html,'//a')}
  • 获取所有a标签的href属性
  1. ${extract.xpaths(resp.html,'//a/@href')}

regx

参数名描述可否为空
string字符串,如resp.html
regx正则表达式

返回值类型:String

采用正则方法抽取一条数据

  • 获取网页title
  1. ${extract.regx(resp.html,'<title>(.*?)</title>')}

regxs

参数名描述可否为空
string字符串,如resp.html
regx正则表达式

返回值类型:String

采用正则方法抽取一组数据

  • 获取所有h2标签内容
  1. ${extract.regxs(resp.html,'<h2>(.*?)</h2>')}

jsonpath

参数名描述可否为空
objectjson对象
jsonpathjsonpath表达式

返回值类型:Object

根据jsonpath抽取数据

  • 获取json根节点下的code属性
  1. ${extract.jsonpath(resp.json,'$.code')}