scws中国語分詞コンポーネント


1.現在使用しているPHPバージョンに基づいて、コンパイルされたphpをダウンロードします.scws.dll拡張ライブラリ.2.ダウンロードしたphp_scws.dllはphpインストールディレクトリのextensions/ディレクトリに格納されます(通常、X:/php/extensions/またはX:/php/ext/).3.ローカルディレクトリのルールセットファイルと辞書ファイルを作成し、C:/program files/scws/etc 4を使用することを推奨する.scwsのホームページから辞書ファイルをダウンロードし、解凍して*.xdbは上記のディレクトリに辞書シリーズを配置します.http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2              http://www.ftphp.com/scws/down/scws-dict-chs-utf8.tar.bz2              http://www.ftphp.com/scws/down/scws-dict-cht-utf8.tar.bz24.phpを修正する.iniは通常C:/windows/phpに位置する.iniまたはC:/wint/php.iniなどのディレクトリはphp.iniの末尾には、[scws];注意phpをチェックしてください.iniのextension_dirの設定値が正しいかどうか、そうでない場合はextension_dirを空にします.php_をscws.dllは絶対パスとして指定します.extension = php_scws.dll scws.default.charset = gbk scws.default.fpath = "c:/program files/scws/etc"5. Webサーバを再開すれば完了します.
<?php
//        
$so = scws_new();
  
$so->set_charset('gbk');
//        set_dict   set_rule          ini               
$so->send_text("       ,  C++  ,     T   ");
while ($tmp = $so->get_result()) {
    print_r($tmp);
}
$so->close();

//         
$sh = scws_open();
 
scws_set_charset($sh, 'gbk');
scws_set_dict($sh, '/path/to/dict.xdb');
scws_set_rule($sh, '/path/to/rules.ini');
$text = "       ,  C++  ,     T   ";
scws_send_text($sh, $text);
$top = scws_get_tops($sh, 5);
print_r($top);
?>

詳細はhightmanフォーラムを参照
<?php
require("splitword.php");//       
$SpWord =new SplitWord();//     
$str="     ";
$words =$SpWord->SplitRMM($str);//     
$SpWord = iconv( "gbk", "utf-8//ignore", $SpWord );
$SplitWord->Clear( );