Python 字元編碼

2022-07-29 09:39:10 字數 377 閱讀 4490

寫爬蟲的時候老是遇到,昨天還把編碼問題列入日程。今天看到前輩們都有總結,就拿來主義了。謝謝。

chown-jane-y 《**python3中的bytes和str型別》

skyflask 《徹底搞清楚python字元編碼》

john_abc 《python-字元編碼詳解》

編碼1 byte(byte,位元組) = 8 bits(位)

1 kb (kilobyte,千位元組)= 1024 bytes

1 mb (megabyte,兆位元組,百萬位元組,簡稱「兆」)  = 1024 kb

1 gb (gigabyte,吉位元組,十億位元組,又稱「千兆」)= 1024 mb

1 tb  (terabyte,萬億位元組,太位元組)=1000gb

python字元編碼

ascii 碼是乙個位元組,通常只能顯示英文本母和數字。unicode碼為了顯示多種語言產生,但是要占用兩個位元組,顯示文字要占用大量空間 utf 8 為了節約空間而生,英文本元只用乙個位元組儲存,中文字元需要三個位元組 character ascii unicode utf 8 a01000000...

python字元編碼

列印python檔案編碼 import sys print sys.getdefaultencoding 中文的乙個字元unicode占用2個位元組。對在於ascii字元占用1個位元組 utf 8中 中文字元佔3個位元組,英文本元占用1個位元組 編碼和轉碼 unicode不能再解碼了 它是基層的 u...

Python字元編碼

在用python程式設計中,字串有兩種表示方法 string 和 u string 為什麼字串要是用這兩種表達方式。不是僅僅用前一種呢?使用type 函式檢視,它們各自是str物件和unicode物件。這兩個物件有什麼差別嗎?還有經經常使用到的encode 和decode 又是幹什麼的呢?都說pyt...