org.jsoup.nodes.Element
xpath
参数名 | 描述 | 可否为空 |
---|---|---|
xpath | xpath表达式 | 否 |
TIP
返回值类型:Element/String
- 根据xpath获取内容或Element对象
${elementVar.xpath('//a/@href')}
xpaths
参数名 | 描述 | 可否为空 |
---|---|---|
xpath | xpath表达式 | 否 |
TIP
返回值类型:List<Element/String>
- 根据xpath获取内容或Element对象
${elementVar.xpaths('//a/@href')}
regx
参数名 | 描述 | 可否为空 |
---|---|---|
pattern | 正则表达式 | 否 |
groups | 捕获组序号int或List<Integer>(多个) | 是 |
TIP
返回值类型:String/List<String>
- 根据正则表达式提取字符串
${elementVar.regx('<title>(.*?)</title>')}
regxs
参数名 | 描述 | 可否为空 |
---|---|---|
pattern | 正则表达式 | 否 |
groups | 捕获组序号int或List<Integer>(多个) | 是 |
TIP
返回值类型:List<String>/List<List<String>>
- 根据正则表达式提取字符串
${elementVar.regxs('<h2>(.*?)</h2>')}
selector
参数名 | 描述 | 可否为空 |
---|---|---|
cssQuery | css选择器 | 否 |
TIP
返回值类型:Element
- 根据css选择器查找dom
${elementVar.selector('div a.selected')}
selectors
参数名 | 描述 | 可否为空 |
---|---|---|
cssQuery | css选择器 | 否 |
TIP
返回值类型:Elements
- 根据css选择器查找dom
${elementVar.selectors('div a.selected')}
attr
参数名 | 描述 | 可否为空 |
---|---|---|
attrName | 属性名 | 否 |
TIP
返回值类型:String
- 获取节点的属性值
${elementVar.attr('src')}
text
TIP
返回值类型:String
- 获取节点的Text
${elementVar.text()}
html
TIP
返回值类型:String
- 获取节点的html
${elementVar.html()}
parent
TIP
返回值类型:Element
- 获取节点的父节点
${elementVar.parent()}
children
TIP
返回值类型:Elements
- 获取节点的子节点
${elementVar.elements()}
当前内容版权归 spider-flow 或其关联方所有,如需对内容或内容相关联开源项目进行关注与资助,请访问 spider-flow .