Exemplo n.º 1
0
 /**
  * 静态方法,访问入口
  * @param string $page            要抓取的网页URL地址(支持https);或者是html源代码
  * @param array  $regArr         【选择器数组】说明:格式array("名称"=>array("选择器","类型"[,"标签过滤列表"][,"回调函数"]),.......[,"callback"=>"全局回调函数"]);
  *                               【选择器】说明:可以为任意的jQuery选择器语法
  *                               【类型】说明:值 "text" ,"html" ,"HTML标签属性" ,
  *                               【标签过滤列表】:可选,当标签名前面添加减号(-)时(此时标签可以为任意的元素选择器),表示移除该标签以及标签内容,否则当【类型】值为text时表示需要保留的HTML标签,为html时表示要过滤掉的HTML标签
  *                               【回调函数】/【全局回调函数】:可选,字符串(函数名) 或 数组(array("类名","类的静态方法")),回调函数应有俩个参数,第一个参数是选择到的内容,第二个参数是选择器数组下标,回调函数会覆盖全局回调函数
  *
  * @param string $regRange       【块选择器】:指 先按照规则 选出 几个大块 ,然后再分别再在块里面 进行相关的选择
  * @param string $getHtmlWay     【源码获取方式】指是通过curl抓取源码,还是通过file_get_contents抓取源码
  * @param string $outputEncoding【输出编码格式】指要以什么编码输出(UTF-8,GB2312,.....),防止出现乱码,如果设置为 假值 则不改变原字符串编码
  */
 public static function Query($page, $regArr, $regRange = '', $getHtmlWay = 'curl', $outputEncoding = false)
 {
     if (!self::$ql instanceof self) {
         self::$ql = new self();
     }
     self::$ql->_query($page, $regArr, $regRange, $getHtmlWay, $outputEncoding);
     return self::$ql;
 }