python 解決中文字串的問題

2022-04-15 07:58:19 字數 433 閱讀 4774

在用python處理資料庫中文字符集時遇到資料庫的個別字段只有一半。結合網上朋友給的思路,使用以下方法進行處理,如果是完整的中文字元似乎是兩個位元組,並且第乙個位元組大於128。

//引數test 輸入字串是gb18030

def cutstr(test):

vlist =

i=0while true:

if i>= len(test) :

break

if ord(test[i])<= 128 :

i=i+1

elif i+1 < len(test) :

i=i+2

else:

i=i+1

str1=""

for x in vlist:

str1=str1 + chr(x)

return str1

Python 解決中文字串問題

本人安裝的是python 2.7版本,由於編寫程式的過程中會碰到中文字串,但由於python預設採用ascii編碼方式,所以對中文不支援。要解決此問題,必須設定當前編碼方式為unicode方式。預設ascii編碼方式對中文字元產生的異常為 unicodedecodeerror ascii codec...

Python中文字串擷取問題

先來看個例子程式設計客棧 程式設計客棧 coding utf8 s u 中文擷取 s.decode utf8 0 3 encode utf8 www.cppcns.com 結果u 中文擷取 延伸閱讀 utf 8中的漢字占用多少位元組?佔2個位元組的 佔3個位元組的 基本等同於gbk,含21000多個...

解決PHP擷取中文字串問題

php擷取字串如果是英文那很好辦,直接用substr就行了,一般不會出現亂碼.中文就有點麻煩了.下面給出兩種解決辦法 一 直接使用multi byte函式庫的mb substr 函式就行了,例項 如下 php echo mb substr str start length encoding echo...