PHP PHPCrawler::addContentTypeReceiveRule Beispiele

Programmiersprache: PHP

Klasse / Typ: PHPCrawler

Methode / Funktion: addContentTypeReceiveRule

Beispiele auf hotexamples.com: 1

PHP PHPCrawler::addContentTypeReceiveRule - 1 Beispiele gefunden. Dies sind die am besten bewerteten PHP Beispiele für die PHPCrawler::addContentTypeReceiveRule, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

__construct(5)

addContentTypeReceiveRule(1)

addURLFilterRule(1)

enableCookieHandling(1)

getProcessReport(1)

go(1)

initCrawlerProcess(1)

setCrawlingDepthLimit(1)

setTrafficLimit(1)

setURL(1)

Beispiel #1

Datei anzeigen

Datei: index.php Projekt: quangtuanle/alano_project

// It may take a whils to crawl a site ...
set_time_limit(10000);
$depth = 2;
// Inculde the phpcrawl-mainclass
include_once "PHPCrawl_083/libs/PHPCrawler.class.php";
// Extend the class and override the handleDocumentInfo()-method
// Now, create a instance of your class, define the behaviour
// of the crawler (see class-reference for more options and details)
// and start the crawling-process.
$crawler = new PHPCrawler();
// URL to crawl
$crawler->setURL("www.vnexpress.net/");
$crawler->setCrawlingDepthLimit(2);
// Only receive content of files with content-type "text/html"
$crawler->addContentTypeReceiveRule("#text/html#");
// Ignore links to pictures, dont even request pictures
$crawler->addURLFilterRule("#\\.(jpg|jpeg|gif|png)\$# i");
// Store and send cookie-data like a browser does
$crawler->enableCookieHandling(true);
// Set the traffic-limit to 1 MB (in bytes,
// for testing we dont want to "suck" the whole site)
$crawler->setTrafficLimit(10000 * 1024);
// Thats enough, now here we go
$crawler->go();
// At the end, after the process is finished, we print a short
// report (see method getProcessReport() for more information)
$report = $crawler->getProcessReport();
if (PHP_SAPI == "cli") {
    $lb = "\n";
} else {