如何判斷含有中文的字串長度

2021-07-16 03:04:31 字數 1017 閱讀 5359

php對中文字串的處理一直困擾於剛剛接觸php開發的新手程式設計師。下面簡要的剖析一下php對中文字串長度的處理:

php自帶的函式如strlen()、mb_strlen()都是通過計算字串所佔位元組數來統計字串長度的,乙個英文本元佔1位元組。例:

$enstr = 'hello,china!';

echo strlen($enstr); // 輸出:12

而中文則不然,做中文**一般會選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能相容更多的字元,所以受到很多站長的喜愛。gbk與utf-8對中文的編碼不同,導致中文在gbk與utf-8編碼下所佔位元組也有差異。

gbk編碼下每個中文字元所佔位元組為2,例:

$zhstr = '您好,中國!';

echo strlen($zhstr); // 輸出:12

utf-8編碼下每個中文字元所佔位元組為3,例:

$zhstr = '您好,中國!';

echo strlen($zhstr); // 輸出:18

那麼如何計算這組中文字串的長度呢?有人可能會說gbk下獲取中文字串長度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字串並不老實,99%的情況會以中英混合的情況出現。

這是wordpress中的一段**,主要思想就是先用正則將字串分解為個體單元,然後再計算單元的個數即字串的長度,**如下(只能處理utf-8編碼下的字串):

$zhstr = '您好,中國!';

$str = 'hello,中國!';

// 計算中文字串長度

function utf8_strlen($string = null)

echo utf8_strlen($zhstr); // 輸出:6

echo utf8_strlen($str); // 輸出:9

utf8_strlen – 獲得utf8編碼的字串的長度

function utf8_strlen($str)

$count++;

}return $count;

}

java 判斷含有中文的字串的長度

public static boolean isletter char c 判斷字串是否為空 param str return public static boolean isnull string str else 得到乙個字串的長度,顯示的長度,乙個漢字或日韓文長度為2,英文本元長度為1 par...

java 判斷含有中文的字串的長度

public static boolean isletter char c 判斷字串是否為空 param str return public static boolean isnull string str else 得到乙個字串的長度,顯示的長度,乙個漢字或日韓文長度為2,英文本元長度為1 par...

java 判斷含有中文的字串的長度

public static boolean isletter char c 判斷字串是否為空 param str return public static boolean isnull string str else 得到乙個字串的長度,顯示的長度,乙個漢字或日韓文長度為2,英文本元長度為1 par...