Python字串前加r u的含義

python字串前加字元r是告訴直譯器該字元是原始字元、不要轉義；原始字串：所有的字串都是直接按照字面的意思來使用，沒有轉義特殊或不能列印的字元。原始字串除在字串的第乙個引號前加上字母"r"（可以大小寫）以外，與普通字串有著幾乎完全相同的語法。

python字串前加字元u是告訴直譯器該字元是按照unicode編碼，防止源**中的中文導致**異常；因為python內部預設編碼方式為unicode編碼，外部編碼方式預設為ascii編碼，我們在**中使用中文時需要告訴直譯器其編碼方式，常用的就是在**檔案的最前端新增如下：

# -*- coding: utf-8 -*-

這就是告知python我這個檔案裡的文字是用utf-8編碼的，這樣，python就會依照utf-8的編碼形式解讀其中的字元，然後轉換成unicode編碼內部處理使用。

不過這種方式處理會存在異常，當系統編碼方式不是utf-8時，螢幕列印就會異常，解決辦法可以將上面的頭改為系統的編碼方式；也可以保持原始碼檔案的utf-8不變，而是在』哈』前面加個u字，也就是:

s1=u』哈』
print s1

這樣就可以正確列印出』哈』字了。

這裡的這個u表示將後面跟的字串以unicode格式儲存。python會根據**第一行標稱的utf-8編碼識別**中的漢字』哈』，然後轉換成unicode物件。如果我們用type檢視一下』哈』的資料型別type(『哈』)，會得到，而type(u』哈』)，則會得到，也就是在字元前面加u就表明這是乙個unicode物件，這個字會以unicode格式存在於記憶體中，而如果不加u，表明這僅僅是乙個使用某種編碼的字串，編碼格式取決於python對原始碼檔案編碼的識別，這裡就是utf-8。

python在向控制台輸出unicode物件的時候會自動根據輸出環境的編碼進行轉換，但如果輸出的不是unicode物件而是普通字串，則會直接按照字串的編碼輸出字串，從而出現上面的現象。

使用unicode物件的話，除了這樣使用u標記，還可以使用unicode類以及字串的encode和decode方法。

unicode類的建構函式接受乙個字串引數和乙個編碼引數，將字串封裝為乙個unicode，比如在這裡，由於我們用的是utf-8編碼，所以unicode中的編碼引數使用』utf-8′將字元封裝為unicode物件，然後正確輸出到控制台：

s1=unicode(『哈』, 『utf-8′)
print s1

關於python的其他字串運算子，請檢視python字串運算子

Python字串前加r u的含義

簡單了解python字串前面加r,u的含義

python 字串前加 b u r 含義

python字串前加「u r b f」的作用

Python字串前加r u的含義

簡單了解python字串前面加r,u的含義

python 字串前加 b u r 含義

python字串前加「u r b f」的作用

相關推薦