python中文字元擷取亂碼

2021-09-30 14:04:37 字數 1286 閱讀 5809

python學習中

python中關於中文字串擷取的問題:中文字元擷取亂碼

在python中乙個中文字元佔三個英文本元,看以下**:

print

str[0:6] #擷取啤酒兩個中文字元,需要從0開始截到6

print str[0:5]
輸出:
啤酒啤��
就會出現亂碼
#!/usr/bin/python

# -*- coding: utf-8 -*-

str = "啤酒的聖經"

print

str

print

str*

2

print

str+

"英國"

print

str[0:]

print

str[0:6] #擷取啤酒兩個中文字元,需要從0開始截到6

print

str[0:15]

print str[0:5]
str = 'hello world!'

print str           # 輸出完整字串

print str[0]        # 輸出字串中的第乙個字元

print str[2:5]      # 輸出字串中第三個至第五個之間的字串

print str[2:]       # 輸出從第三個字元開始的字串

print str * 2       # 輸出字串兩次

print str + "test"  # 輸出連線的字串

輸出:

啤酒的聖經

啤酒的聖經啤酒的聖經

啤酒的聖經英國

啤酒的聖經啤酒啤酒的聖經

啤��
hello world!

hllo

llo world!

hello world!hello world!

hello world!test

PHP函式substr 擷取中文字元亂碼

substr 函式在擷取字串時是按位元組來擷取的,在gbk gb2312編碼下,乙個中文佔2個位元組 utf 8 unicode編碼下,乙個中文佔3個位元組。text 竹杖芒鞋輕勝馬,誰怕?一蓑煙雨任平生。echo text n 竹杖芒鞋輕勝馬,誰怕?一蓑煙雨任平生。echo strlen text...

mysql擷取中文字元 mysql 擷取中文字元

1 char n 型別 char型別時定長的型別,即當定義的是char 10 輸入的是 abc 這三個字元時,它們佔的空間一樣是10個位元組,包括7個空位元組。當輸入的字元長度超過指定的數時,char會擷取超出的字元。而且,當儲存char值時,mysql是自動刪除輸入字串末尾的空格。char是適合儲...

QT 中文字元亂碼

qstring qbytearray 後位元組碼與window下的不對。下面的中文字元 中國人民億 data是我正常後的gbk位元組,value是直接使用 qstring totoutf8 qstring tolocal8bit 之類的與期望不符的位元組碼。首先qstring 轉換成qbytearr...