PHP Zrashwani\NewsScrapper Selector 예제들

프로그래밍 언어: PHP

네임스페이스/패키지 이름: Zrashwani\NewsScrapper

클래스/타입: Selector

hotexamples.com에서의 예제들: 3

PHP Zrashwani\NewsScrapper Selector - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 PHP의 Zrashwani\NewsScrapper\Selector에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

isXPath(2)

isCSS(1)

예제 #1

파일 보기

파일: Client.php 프로젝트: zrashwani/news-scrapper

 /**
  * scrap one source of news
  * @param string   $baseUrl      url to scrap list of news from
  * @param string   $linkSelector css selector for news links in page
  * @param int|NULL $limit        limit of news article to scrap,
  *      if not set it will scrap all matching the selector
  * @return array array of article items scrapped
  */
 public function scrapLinkGroup($baseUrl, $linkSelector, $limit = null)
 {
     $crawler = $this->scrapClient->request('GET', $baseUrl);
     $scrap_result = array();
     $theAdapter = new Adapters\DefaultAdapter();
     $theAdapter->currentUrl = $baseUrl;
     $isXpath = Selector::isXPath($linkSelector);
     $method = $isXpath === false ? 'filter' : 'filterXPath';
     $crawler->{$method}($linkSelector)->each(function (Crawler $link_node) use(&$scrap_result, $theAdapter, &$limit) {
         if (!is_null($limit) && count($scrap_result) >= $limit) {
             return;
         }
         $link = $theAdapter->normalizeLink($link_node->attr('href'), true);
         //remove hash before scrapping
         $article_info = $this->getLinkData($link);
         $this->setAdapter('');
         //reset default adapter after scrapping one link
         $scrap_result[$link] = $article_info;
     });
     return $scrap_result;
 }

예제 #2

파일 보기

파일: AbstractAdapter.php 프로젝트: zrashwani/news-scrapper

 /**
  * extract image source by selector
  * @param  Crawler $crawler
  * @param  string $selector
  * @return string|NULL
  */
 protected function getSrcByImgSelector(Crawler $crawler, $selector)
 {
     $ret = null;
     $imgExtractClosure = function (Crawler $node) use(&$ret) {
         $ret = $node->attr('src');
     };
     if (Selector::isXPath($selector)) {
         $crawler->filterXPath($selector)->each($imgExtractClosure);
     } else {
         $crawler->filter($selector)->each($imgExtractClosure);
     }
     if (empty($ret) === false) {
         return $this->normalizeLink($ret);
     } else {
         return null;
     }
 }

예제 #3

파일 보기

파일: CustomAdapter.php 프로젝트: zrashwani/news-scrapper

 /**
  * getting text of element by selector (css selector or xpath )
  * @param Crawler $crawler
  * @param string $selector
  * @param \Closure $extractClosure callback function to be used for extraction
  * @return string
  */
 protected function getElementText(Crawler $crawler, $selector, $extractClosure = null)
 {
     if (empty($selector) === true) {
         return null;
     }
     $ret = null;
     if ($extractClosure === null) {
         $extractClosure = function (Crawler $node) use(&$ret) {
             $ret = $node->html();
         };
     }
     if (Selector::isCSS($selector)) {
         $crawler->filter($selector)->each($extractClosure);
     } else {
         $crawler->filterXPath($selector)->each($extractClosure);
     }
     return $ret;
 }