python逐個遍歷字串 含漢字

2021-08-22 16:34:19 字數 725 閱讀 4264

s = "中國china"

for j in s:

print j

首先乙個,你這個』a』是什麼編碼?可能不是你所想的gbk

>>> a='中國'

>>> a

這樣試試看,如果出來是6個字(word),說明是utf-8,如果是4個字,說明gbk。

另外,不管是utf-8還是gbk,都不能這樣遍歷,因為這裡它會乙個字乙個字拿出來。虛擬機器把a當成乙個長度為len(a)的字串了。

接下來是遍歷問題。

linux的shell大都預設是utf-8,所以乙個中文字元是三個字,所以要三個三個地讀,你可以試下:

>>> a

[:3]

出來就是個」中」字

windows的command的預設是cp936,也就是gbk,乙個中文字元是兩個字,所以兩個字兩個字地讀(a[:2])。

還有另一種遍歷的方法,把字串轉換成unicode,這樣中文英文都是乙個字,就可以用你的for i in a的方法遍歷了。這個的好處是中文英文本元都是乙個字,而utf-8和gbk裡,英文本母只佔乙個字。

s = u"中國china"

for j in s:

print j

輸出如下:

中國c

hina

python 遍歷字串 含漢字 例項詳解

python 遍歷字串 含漢字 例項詳解 s 中國china for j 程式設計客棧in s print j 首先乙個,你這個 a 是什麼編碼?可能不是你所想的gbk a 中國 a 這樣試試看,如果出來是6個字 word 說明是utf 8,如果是4個字,說明gbk。另外,不管是utf 8還是gbk...

Python字串 遍歷

很多計算過程都需要每次從乙個字串中取乙個字元。一般都是從頭開始讀取,依次得到每個字元,然後做些處理,一直到末尾。這種處理模式叫遍歷。1.使用while迴圈寫乙個遍歷 cat a.py bin python fruit banana index 0 while index len fruit pyth...

遍歷字串

遍歷字串的三種方法 1 for迴圈 字元陣列 include include define max size 1024 int main int i int len printf please input string gets src len strlen src printf string fo...