php正規表現文字列から漢字を除く文字を除去(漢字のみ保持)

858 ワード

<?php 
//               
header("Content-type: text/html; charset=utf-8");
$str='f ,  。,.'; 
preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches);
$str = join('', $matches[0]);
echo $str;
?> 

PHPは正規表現を用いて文字列の中の中国語をどのようにマッチングするかという問題に対して、ネット上にも多くのコードがありますが、ほとんどが漏れているので、以下では本当に中国語をマッチングできるコードを提供します.2つのコード形式に分けられます.
1)utf-8の符号化フォーマットで、中国語の符号に一致するのは以下の通りである.

2)gb 2312の符号化フォーマットで、中国語文字列コードに一致するのは以下の通りである.