书栈网 · BookStack 本次搜索耗时 0.020 秒,为您找到 101 个相关结果.
  • html

    QueryList html($html) 用法 QueryList html($html) 设置待采集的html源码,等价于setHtml($html) 用法 $html = file_get_contents ( 'https://querylist.cc/' ); $ql = QueryList :: html ( ...
  • 处理乱码

    处理乱码 一.使用QueryList内置的乱码解决方案 二.自己手动转码页面,然后再把页面传给QueryList 处理乱码 内容乱码是采集过程中很常见的问题。 出现乱码的问题很多,解决方法也不尽相同,要视具体情况而定,以下几种乱码解决方案仅供参考。 一.使用QueryList内置的乱码解决方案 1.使用编码转换插件,设置输入输出编码 ...
  • range

    QueryList range($selector) 用法 QueryList range($selector) 区域选择器 或者叫做切片选择器 ,指先按照该规则对HTML内容进行切片 ,然后再分别再在这些切片里面进行相关的选择。当采集列表的时候,建议设置这个参数。 用法 例一采集百度搜索结果,下面两种写法采集结果一致 : //第...
  • getData

    getData( ) 方法 参数: $callback 用法 添加需求 继续添加需求 完整代码 getData( ) 方法 返回值:array 获取采集结果数据的结果数据,并可以进一步处理结果。 原型: getData ( $callback = null ) 参数: $callback 类型:callbac...
  • getInstance

    getInstance( ) 方法 参数: $class 参数:$arg1,$arg2,…… 用法 getInstance( ) 方法 返回值:实例对象 获取任意类的单例,QueryList内部方法,开放出来供大家使用。 原型: getInstance ( $class , $arg1 , $arg2 ,......) ...
  • bind

    QueryList bind(string $name,Closure $provide) 用法 QueryList bind(string $name,Closure $provide) 用法 QueryList功能扩展,绑定一个功能函数到QueryList对象,轻量级功能扩展,可以理解为注册了一个插件。可静态调用或动态调用。 参数: $...
  • Puppeteer

    Puppeteer 插件 环境要求 安装 插件注册选项 API 用法 调试 页面截图 启动可视化Chrome浏览器 Puppeteer 插件 使用Puppeteer采集JavaScript动态渲染的页面。使用此插件需要有一定的Node.js基础知识,并且会配置Node运行环境。 此插件是基于PuPHPeteer 包的简单封装,...
  • destruct

    QueryList destruct() 用法 QueryList destruct() 用法 释放资源,销毁内存占用。在涉及到循环采集大量网页的场景下,这个方法是很有用的。 注意 :此方法并不是销毁QueryList对象,只是销毁phpQuery Document占用的内存,所以调用此方法后,原先设置过HTML的QueryList对象都会丢...
  • setQuery

    setQuery( ) 方法 用法 setQuery( ) 方法 返回值:QueryList对象 重新设置选择器,不会再次重复的取抓取一遍目标页面源码,用于重复采集同一个页面多处的内容。 原型: setQuery ( array $rules , $range = '' , $outputEncoding = null , ...
  • 内容过滤

    内容过滤 单元素采集场景 列表采集场景 第一种方法:使用内容过滤选择器参数 第二种方式:结合remove()方法 内容过滤 从采集内容中移除掉多余无用内容。 单元素采集场景 列表采集场景 很多时候我们采集回来的内容中会包含一些"杂质",如果只是想要移除或替换内容中的某些关键词,直接用字符串替换函数就可以轻松解决,但往往实际情况没这么简...