Python去除抓取欄位中的特殊字元

一共有四種方法，其中只有第一種需要匯入一下 import re，其他不需要匯入，想快速簡單解決問題，直接看方法三

import re
str =' \n \u3000\u30002023年4月10日，號稱 「世界工業史上的奇蹟」的豪華客輪鐵達尼號開始了自己的**航，從英國的南安普頓出發駛往美國紐約。富家少女羅絲（凱特•溫絲萊特）與母親及未婚夫卡爾坐上了頭等艙；另一邊，放蕩不羈的少年畫家傑克（萊昂納多·迪卡普里奧）也在碼頭的一場賭博中贏得了下等艙的船票。\n \n \u3000\u3000羅絲厭倦了上流社會虛偽的生活，不願嫁給卡爾，打算投海自盡，被傑克救起。很快，美麗活潑的羅絲與英俊開朗的傑克相愛，傑克帶羅絲參加下等艙的舞會、為她畫像，二人的感情逐漸公升溫。\n \n \u3000\u30002023年4月14日，星期天晚上，乙個風平浪靜的夜晚。鐵達尼號撞上了冰山，「永不沉沒的」鐵達尼號面臨沉船的命運，羅絲和傑克剛萌芽的愛情也將經歷生死的考驗。\n '
##方法一：注意匯入 import re 
#採用的是sub替換
resultstr = re.sub(r' ','',re.sub(r'\u3000','',re.sub(r'\n','',str)))
print(resultstr)
##方法二：
#採用的是replace替換
resultstr = str.replace(' ','').replace('\n','').replace('\u3000','')
print(resultstr)
##方法三：
# 採用的是split()直接去除特殊字元
resultstr = "".join(str.split())
print(resultstr)
##方法四：
# 採用的是translate去除特殊字元，move裡面 '\n\u3000 '是需要切掉的字元
move = dict.fromkeys((ord(c) for c in u'\n\u3000 '))
resultstr = str.translate(move)
print(resultstr)

各位按需索取吧，執行結果：

2023年4月10日，號稱「世界工業史上的奇蹟」的豪華客輪鐵達尼號開始了自己的**航，從英國的南安普頓出發駛往美國紐約。富家少女羅絲（凱特•溫絲萊特）與母親及未婚夫卡爾坐上了頭等艙；另一邊，放蕩不羈的少年畫家傑克（萊昂納多·迪卡普里奧）也在碼頭的一場賭博中贏得了下等艙的船票。羅絲厭倦了上流社會虛偽的生活，不願嫁給卡爾，打算投海自盡，被傑克救起。很快，美麗活潑的羅絲與英俊開朗的傑克相愛，傑克帶羅絲參加下等艙的舞會、為她畫像，二人的感情逐漸公升溫。2023年4月14日，星期天晚上，乙個風平浪靜的夜晚。鐵達尼號撞上了冰山，「永不沉沒的」鐵達尼號面臨沉船的命運，羅絲和傑克剛萌芽的愛情也將經歷生死的考驗。

Python去除抓取欄位中的特殊字元

sqlServer去除欄位中的中文

去除XML標籤提取內容以及去除內容中的特殊字元

sql中擷取字段資料的函式

Python去除抓取欄位中的特殊字元

sqlServer去除欄位中的中文

去除XML標籤提取內容以及去除內容中的特殊字元

sql中擷取字段資料的函式

相關推薦