python unicode位元組串轉成中文問題

2022-05-06 06:33:10 字數 471 閱讀 5382

example 2:

>>> str_ = "russopho\xe9bic, clichd and just pl\xe9ain stupid."

>>> print str_

russopho?bic, clichd and just pl?ain stupid.

>>> str_ = str_.decode("unicode_escape")

>>> print str_

russophoébic, clichd and just pléain stupid.

(這個方法解決了我在插入資料到mongodb時遇到的「bson.errors.invalidstringdata: strings in documents must be valid utf-8」問題)

不一樣,可能是一邊是unicode位元組串,一邊是字串。詳見

小結:以後遇到奇葩問題要想好關鍵字再搜,不然很有可能一無所獲。

python Unicode程式設計

ascii美國標準資訊交換碼 utf 88為utf轉換格式 無符號位元組序列,長度為1 4個位元組 utf 1616位utf轉換格式 無符號位元組序列,通常是16位長,兩個位元組 unicode可以表示超過90000個字元。ascii字串成了stringtype,而unicode字串成了unicod...

python Unicode 編碼問題

今天在用python寫分頁 傳入兩個引數 page num,page size,報錯了 我用的是python2.7 列印變數型別是unicode 所以要把unicode 轉成 int 提供兩種方法,都是先轉成字串,再轉成int page num int filter str.isdigit,page...

python unicode 編碼整理

unicode 只定義字元對應的數字,但沒有規定這些數字如何儲存起來,比如像中文的 我 字儲存時需要兩個位元組來表示,而英文本母a卻只需要乙個位元組,有些其他的字元可能需要3 4個位元組。utf 8 是對 unicode 編碼儲存的一種實現方式,同樣的還有 utf 16,utf 32。utf 8 是...