org.jsoup.select.Elements
xpath
参数名 | 描述 | 可否为空 |
---|---|---|
xpath | xpath表达式 | 否 |
TIP
返回值类型:Element/String
- 根据xpath获取内容或Element对象
${elementsVar.xpath('//a/@href')}
xpaths
参数名 | 描述 | 可否为空 |
---|---|---|
xpath | xpath表达式 | 否 |
TIP
返回值类型:List<Element/String>
- 根据xpath获取内容或Element对象
${elementsVar.xpaths('//a/@href')}
regx
参数名 | 描述 | 可否为空 |
---|---|---|
pattern | 正则表达式 | 否 |
groups | 捕获组序号int或List<Integer>(多个) | 是 |
TIP
返回值类型:String/List<List<String>
- 根据正则表达式提取字符串
${elementsVar.regx('<title>(.*?)</title>')}
regxs
参数名 | 描述 | 可否为空 |
---|---|---|
pattern | 正则表达式 | 否 |
groups | 捕获组序号int或List<Integer>(多个) | 是 |
TIP
返回值类型:List<String>/List<List<String>>
- 根据正则表达式提取字符串
${elementsVar.regxs('<h2>(.*?)</h2>')}
selector
参数名 | 描述 | 可否为空 |
---|---|---|
cssQuery | css选择器 | 否 |
TIP
返回值类型:Element
- 根据css选择器查找dom
${elementsVar.selector('div a.selected')}
selectors
参数名 | 描述 | 可否为空 |
---|---|---|
cssQuery | css选择器 | 否 |
TIP
返回值类型:Elements
- 根据css选择器查找dom
${elementsVar.selectors('div a.selected')}
attr
参数名 | 描述 | 可否为空 |
---|---|---|
attrName | 属性名 | 否 |
TIP
返回值类型:String
- 获取第一个节点的属性值
${elementsVar.attr('src')}
attrs
参数名 | 描述 | 可否为空 |
---|---|---|
attrName | 属性名 | 否 |
TIP
返回值类型:List<String>
- 获取所有节点的属性值
${elementsVar.attrs('src')}
text
TIP
返回值类型:String
- 获取第一个节点的Text
${elementsVar.text()}
texts
TIP
返回值类型:List<String>
- 获取所有节点节点的Text
${elementsVar.texts()}
html
TIP
返回值类型:String
- 获取第一个节点的html
${elementsVar.html()}
htmls
TIP
返回值类型:List<String>
- 获取所有节点的html
${elementsVar.htmls()}
当前内容版权归 spider-flow 或其关联方所有,如需对内容或内容相关联开源项目进行关注与资助,请访问 spider-flow .