Python擷取中文字串

2021-08-19 01:21:15 字數 485 閱讀 5633

在gbk編碼下,請編寫乙個擷取字串的函式,輸入為乙個字串和位元組數,輸出為按位元組擷取的字串,但是要保證漢字不被截半個,同時忽略字串中的數字後輸出最終結果

#-*-coding:gbk -*-

import re

deffunc

(s,length):

g=''.join(re.findall(r'\d',s)) #這裡也可以用g=filter(lambda x:x not in '0123456789',s)

i=int(length)

us=g[:i]

#print us

while

true:

try:

unicode(us,'gbk')

break

except:

us=g[:i-1]

return us

print func('我1a你bc',4)

Python中文字串擷取問題

先來看個例子程式設計客棧 程式設計客棧 coding utf8 s u 中文擷取 s.decode utf8 0 3 encode utf8 www.cppcns.com 結果u 中文擷取 延伸閱讀 utf 8中的漢字占用多少位元組?佔2個位元組的 佔3個位元組的 基本等同於gbk,含21000多個...

golang擷取中文字串

1.問題 在golang中可以通過切片擷取乙個陣列或字串,但是當擷取的字串是中文時,可能會出現的問題是 由於中文乙個字不只是由乙個位元組組成,所以直接通過切片可能會把乙個中文字的編碼截成兩半,結果導致最後乙個字元是亂碼。例如 想要擷取前四個字 fmt.println name 4 name 4 執行...

PHP 中文字串擷取

本文提供兩種方法實現中文字串的擷取 1.使用系統提供的 mb substr 或iconv substr 函式 php.ini 配置檔案中的 mbstring 擴充套件要開啟才能使用 函式說明 string mb substr string str,int start int length null ...