PHP LanguageUtf8::stripForSearchの例

プログラミング言語: PHP

クラス/型: LanguageUtf8

メソッド/関数: stripForSearch

hotexamples.comのコード掲載数: 2

PHP LanguageUtf8::stripForSearch - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPHPのLanguageUtf8::stripForSearchの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

__construct(30)

LanguageUtf8(10)

getMessage(6)

getDefaultUserOptions(5)

lc(2)

stripForSearch(2)

ucfirst(2)

date(1)

formatDay(1)

getBookstoreList(1)

getMagicWords(1)

getNamespaces(1)

getSkinNames(1)

isMultibyte(1)

timeanddate(1)

uc(1)

コード例 #1

ファイルを表示

ファイル: LanguageZh.php プロジェクト: BackupTheBerlios/openzaurus-svn

 function stripForSearch($string)
 {
     $fname = "LanguageZh::stripForSearch";
     wfProfileIn($fname);
     // eventually this should be a word segmentation
     // for now just treat each character as a word
     $t = preg_replace("/([\\xc0-\\xff][\\x80-\\xbf]*)/e", "' ' .\"\$1\"", $string);
     //always convert to zh-cn before indexing. it should be
     //better to use zh-cn for search, since conversion from
     //Traditional to Simplified is less ambiguous than the
     //other way around
     $t = $this->mConverter->autoConvert($t, 'zh-cn');
     $t = LanguageUtf8::stripForSearch($t);
     wfProfileOut($fname);
     return $t;
 }

コード例 #2

ファイルを表示

ファイル: LanguageJa.php プロジェクト: k-hasan-19/wiki

 function stripForSearch($string)
 {
     # MySQL fulltext index doesn't grok utf-8, so we
     # need to fold cases and convert to hex
     $s = $string;
     # Strip known punctuation ?
     #$s = preg_replace( '/\xe3\x80[\x80-\xbf]/', '', $s ); # U3000-303f
     # Space strings of like hiragana/katakana/kanji
     $hiragana = '(?:\\xe3(?:\\x81[\\x80-\\xbf]|\\x82[\\x80-\\x9f]))';
     # U3040-309f
     $katakana = '(?:\\xe3(?:\\x82[\\xa0-\\xbf]|\\x83[\\x80-\\xbf]))';
     # U30a0-30ff
     $kanji = '(?:\\xe3[\\x88-\\xbf][\\x80-\\xbf]' . '|[\\xe4-\\xe8][\\x80-\\xbf]{2}' . '|\\xe9[\\x80-\\xa5][\\x80-\\xbf]' . '|\\xe9\\xa6[\\x80-\\x99])';
     # U3200-9999 = \xe3\x88\x80-\xe9\xa6\x99
     $s = preg_replace("/({$hiragana}+|{$katakana}+|{$kanji}+)/", ' $1 ', $s);
     # Double-width roman characters: ff00-ff5f ~= 0020-007f
     $s = preg_replace('/\\xef\\xbc([\\x80-\\xbf])/e', 'chr((ord("$1") & 0x3f) + 0x20)', $s);
     $s = preg_replace('/\\xef\\xbd([\\x80-\\x99])/e', 'chr((ord("$1") & 0x3f) + 0x60)', $s);
     # Do general case folding and UTF-8 armoring
     return LanguageUtf8::stripForSearch($s);
 }