字串和編碼

2022-07-18 08:12:11 字數 932 閱讀 6150

編碼

ascii   unicode  utf-8

ascii編碼和unicode編碼的區別:ascii編碼是1個位元組,而unicode編碼通常是2個位元組。utf-8編碼把乙個unicode字元根據不同的數字大小編碼成1-6個位元組,常用的英文本母被編碼成1個位元組,漢字通常是3個位元組,只有很生僻的字元才會被編碼成4-6個位元組。如果你要傳輸的文字包含大量英文本元,用utf-8編碼就能節省空間。

字串在最新的python 3版本中,字串是以unicode編碼的,也就是說,python的字串支援多語言。

由於python源**也是乙個文字檔案,所以,當你的源**中包含中文的時候,在儲存源**時,就需要務必指定儲存為utf-8編碼。當python直譯器讀取源**時,為了讓它按utf-8編碼讀取,我們通常在檔案開頭寫上這兩行:

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

第一行注釋是為了告訴linux/os x系統,這是乙個python可執行程式,windows系統會忽略這個注釋;

第二行注釋是為了告訴python直譯器,按照utf-8編碼讀取源**,否則,你在源**中寫的中文輸出可能會有亂碼。

常見的佔位符有:

佔位符替換內容

%d整數

%f浮點數

%s字串

%x十六進製制整數

另一種格式化字串的方法是使用字串的format()方法,它會用傳入的引數依次替換字串內的佔位符……,不過這種方式寫起來比%要麻煩得多:

>>> 'hello, , 成績提公升了 %'.format('小明', 17.125)

'hello, 小明, 成績提公升了 17.1%'

MySQL字串和編碼

1 utf 8和utf8有區別,在mysql query中使用utf 8可能會導致phpmyadmin顯示亂碼 2 utf8 general ci和utf8 unicode ci有區別,前者效率更高,但後者比較規則更完備,一般使用前者 3 在php中utf 8中文字元長度為3個字元,gbk長度為2個...

MySQL字串和編碼

1 utf 8和utf8有區別,在mysql query中使用utf 8可能會導致phpmyadmin顯示亂碼 2 utf8 general ci和utf8 unicode ci有區別,前者效率更高,但後者比較規則更完備,一般使用前者 3 在php中utf 8中文字元長度為3個字元,gbk長度為2個...

字串編碼和解碼

計算機底層通過二進位制儲存資料,字串的儲存和展示有這樣的關係 字串 字元 二進位制儲存 在傳統的編碼方式中,如 ascii iso 8859 1,是直接將字元與二進位制數進行了對映,形成乙個字元表。這樣,儲存字串時,查詢字元表,把其中每個字元都用對應的二進位制數進行表示。當展示資料時,同樣查詢字元表...