百度面接:ansiコードのアルファベットと数字を削除
1173 ワード
1つの文字列がGBK漢字とansi符号化の数字アルファベットの混合からなることが知られており、C言語関数を記述して、元の文字列に結果を返すことを要求するansi符号化の数字とアルファベット(大文字と小文字を含む)をすべて削除することを実現する.関数インタフェース:int filter_ansi(char*gbk_string).注:漢字のGBK符号化範囲は0 x 8140-0 xFEFE
コードには、ansi符号化と数字のみが削除され、他の非漢字文字があれば保持されます.
漢字とアルファベット、数字を区別して、最高位が1かどうかを見ます!
コードには、ansi符号化と数字のみが削除され、他の非漢字文字があれば保持されます.
漢字とアルファベット、数字を区別して、最高位が1かどうかを見ます!
int filter_ansi(char* gbk_string)
{
char *p = gbk_string, *q = gbk_string;
while (*q != '\0')
{
if ((*q >= 0) && (*q <= 128)) // asci
{
if (((*q >= '0') && (*q <= '9')) //
|| ((*q >= 'a') && (*q <= 'z'))
|| ((*q >= 'A') && (*q <= 'Z')))
{
q++;
}
else
{
*p++ = *q++;
}
}
else
{
if (((*((unsigned short*)q)) >= 0x8140) && ((*((unsigned short*)q)) <= 0xFEFE)) //
{
*p++ = *((char*)q)++;
*p++ = *((char*)q)++;
}
else //
{
q++;
q++;
}
}
}
*p = '\0';
return (p - gbk_string);
}