PHP Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num::tokenize示例

编程语言: PHP

类/类型: Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num

方法/功能: tokenize

hotexamples.com的示例: 2

PHP Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num::tokenize - 已找到2个示例。这些是从开源项目中提取的最受好评的Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num::tokenize现实PHP示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

tokenize(2)

__construct(1)

addFilter(1)

示例#1

显示文件

文件： AnalysisTest.php 项目： jon9872/zend-framework

 public function testUtf8Num()
 {
     if (@preg_match('/\\pL/u', 'a') != 1) {
         // PCRE unicode support is turned off
         return;
     }
     $analyzer = new Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num();
     // UTF-8 text with a cyrillic symbols
     $tokenList = $analyzer->tokenize('Слово1 Слово2 ДругоеСлово', 'UTF-8');
     $this->assertEquals(count($tokenList), 3);
     $this->assertEquals($tokenList[0]->getTermText(), 'Слово1');
     $this->assertEquals($tokenList[0]->getStartOffset(), 0);
     $this->assertEquals($tokenList[0]->getEndOffset(), 6);
     $this->assertEquals($tokenList[0]->getPositionIncrement(), 1);
     $this->assertEquals($tokenList[1]->getTermText(), 'Слово2');
     $this->assertEquals($tokenList[1]->getStartOffset(), 7);
     $this->assertEquals($tokenList[1]->getEndOffset(), 13);
     $this->assertEquals($tokenList[1]->getPositionIncrement(), 1);
     $this->assertEquals($tokenList[2]->getTermText(), 'ДругоеСлово');
     $this->assertEquals($tokenList[2]->getStartOffset(), 14);
     $this->assertEquals($tokenList[2]->getEndOffset(), 25);
     $this->assertEquals($tokenList[2]->getPositionIncrement(), 1);
 }

示例#2

显示文件

文件： AnalysisTest.php 项目： jorgenils/zend-framework

 public function testUtf8Num()
 {
     $analyzer = new Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num();
     // UTF-8 text with a cyrillic symbols
     $tokenList = $analyzer->tokenize('Слово1 Слово2 ДругоеСлово');
     $this->assertEquals(count($tokenList), 3);
     $this->assertEquals($tokenList[0]->getTermText(), 'Слово1');
     $this->assertEquals($tokenList[0]->getStartOffset(), 0);
     $this->assertEquals($tokenList[0]->getEndOffset(), 6);
     $this->assertEquals($tokenList[0]->getPositionIncrement(), 1);
     $this->assertEquals($tokenList[1]->getTermText(), 'Слово2');
     $this->assertEquals($tokenList[1]->getStartOffset(), 7);
     $this->assertEquals($tokenList[1]->getEndOffset(), 13);
     $this->assertEquals($tokenList[1]->getPositionIncrement(), 1);
     $this->assertEquals($tokenList[2]->getTermText(), 'ДругоеСлово');
     $this->assertEquals($tokenList[2]->getStartOffset(), 14);
     $this->assertEquals($tokenList[2]->getEndOffset(), 24);
     $this->assertEquals($tokenList[2]->getPositionIncrement(), 1);
 }