PHP UTF 8中国語文字遮断関数コード
2922 ワード
phpにおける英語ハイブリッド文字遮断不乱符号関数(utf 8)
実は、PHP原生には多くのcharsetの下の文字の切り取り案があります.ええ、だからそうです.��..
Multibyte String Functions関数ファミリーでは、
string mb_substr(string$str,int$start[,int$length[,string$encoding]))文字列切り取りに使用
int mb_strlen(string$str[,string$encoding])は文字列の長さを返します.
....
詳しくはPHPマニュアルをご覧ください
//utf8
//$sourcestr
//$cutlength ( )
//$addstr
function cut_str($sourcestr, $cutlength, $addstr='...'){
$returnstr='';
$i=0;
$n=0;
$str_length=strlen($sourcestr);//
while (($n $temp_str=substr($sourcestr,$i,1);
$ascnum=Ord($temp_str);// $i ascii
if ($ascnum>=224){ // ASCII 224,
$returnstr=$returnstr.substr($sourcestr,$i,3); // UTF-8 , 3
$i=$i+3; // Byte 3
$n++; // 1
}elseif ($ascnum>=192){ // ASCII 192,
$returnstr=$returnstr.substr($sourcestr,$i,2); // UTF-8 , 2
$i=$i+2; // Byte 2
$n++; // 1
}elseif ($ascnum>=65 && $ascnum<=90){ // ,
$returnstr=$returnstr.substr($sourcestr,$i,1);
$i=$i+1; // Byte 1
$n++; // ,
}else{ // , ,
$returnstr=$returnstr.substr($sourcestr,$i,1);
$i=$i+1; // Byte 1
$n=$n+0.5; // ...
}
}
if ($str_length>$cutlength){
$returnstr = $returnstr . $addstr;//
}
return $returnstr;
}
/* UTF-8 */
$str = "123 ";
$str1 = "()()";
echo subUTF8str($str,0,3)."
";
echo subUTF8str($str,0,4)."
";
echo subUTF8str($str1,0,4)."
";
echo subUTF8str($str1,0,10)."
";
function subUTF8str($str,$start=0,$length=80){
$cur_len = 0; //
$all_len = strlen($str); //
if($length > $all_len)
{
return $str;
}
for($i = 0;$i < $all_len;)
{
if($cur_len == $start)
{
break;
}
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$start_pos = $i;
$temp_pos = $cur_len;
for(;$cur_len - $temp_pos < $length;)
{
if($i >= $all_len)
break;
if (ord($str[$i]) > 127)
{
$i += 3;
}else{
$i += 1;
}
$cur_len ++;
}
$end_pos = $i;
return substr($str,$start_pos,$end_pos);
}
?>
実は、PHP原生には多くのcharsetの下の文字の切り取り案があります.ええ、だからそうです.��..
Multibyte String Functions関数ファミリーでは、
string mb_substr(string$str,int$start[,int$length[,string$encoding]))文字列切り取りに使用
int mb_strlen(string$str[,string$encoding])は文字列の長さを返します.
....
詳しくはPHPマニュアルをご覧ください