快速上手
使用QueyList只需要编写规则库,然后把规则库传给QueryList的静态方法Query,QueryList就会自动按照规则库把内容全部采集回来了,而规则库是用jQuery选择器来编写的,所以使用QueryList的整个过程非常简单!
规则库的编写规则如下(简单模式):
$rules = array(
'规则名' => array('jQuery选择器','要采集的属性'),
'规则名2' => array('jQuery选择器','要采集的属性'),
..........
);
下面我们来动手试试吧:
- 采集目标,下面的代码片段
$html = <<<STR
<div id="one">
<div class="two">
<a href="http://querylist.cc">QueryList官网</a>
<img src="http://querylist.com/1.jpg" alt="这是图片">
<img src="http://querylist.com/2.jpg" alt="这是图片2">
</div>
<span>其它的<b>一些</b>文本</span>
</div>
STR;
2.编写采集规则
$rules = array(
//采集id为one这个元素里面的纯文本内容
'text' => array('#one','text'),
//采集class为two下面的超链接的链接
'link' => array('.two>a','href'),
//采集class为two下面的第二张图片的链接
'img' => array('.two>img:eq(1)','src'),
//采集span标签中的HTML内容
'other' => array('span','html')
);
3.开始采集
$data = QueryList::Query($html,$rules)->data;
//打印结果
print_r($data);
结果如下:
Array
(
[0] => Array
(
[text] =>
QueryList官网
其它的一些文本
[link] => http://querylist.cc
[img] => http://querylist.com/2.jpg
[other] => 其它的<b>一些</b>文本
)
)
如果上面的代码你看懂了,那么恭喜你,你已经成功掌握了QueryList了!
下面是完整代码:
<?php
require 'QueryList/vendor/autoload.php';
use QL\QueryList;
$html = <<<STR
<div id="one">
<div class="two">
<a href="http://querylist.cc">QueryList官网</a>
<img src="http://querylist.com/1.jpg" alt="这是图片">
<img src="http://querylist.com/2.jpg" alt="这是图片2">
</div>
<span>其它的<b>一些</b>文本</span>
</div>
STR;
$rules = array(
//采集id为one这个元素里面的纯文本内容
'text' => array('#one','text'),
//采集class为two下面的超链接的链接
'link' => array('.two>a','href'),
//采集class为two下面的第二张图片的链接
'img' => array('.two>img:eq(1)','src'),
//采集span标签中的HTML内容
'other' => array('span','html')
);
$data = QueryList::Query($html,$rules)->data;
print_r($data);