Python去除抓取欄位中的特殊字元

2021-09-02 23:30:46 字數 1573 閱讀 5796

一共有四種方法,其中只有第一種需要匯入一下 import re,其他不需要匯入,想快速簡單解決問題,直接看方法三

import re

str =' \n \u3000\u30002023年4月10日,號稱 「世界工業史上的奇蹟」的豪華客輪鐵達尼號開始了自己的**航,從英國的南安普頓出發駛往美國紐約。富家少女羅絲(凱特•溫絲萊特)與母親及未婚夫卡爾坐上了頭等艙;另一邊,放蕩不羈的少年畫家傑克(萊昂納多·迪卡普里奧)也在碼頭的一場賭博中贏得了下等艙的船票。\n \n \u3000\u3000羅絲厭倦了上流社會虛偽的生活,不願嫁給卡爾,打算投海自盡,被傑克救起。很快,美麗活潑的羅絲與英俊開朗的傑克相愛,傑克帶羅絲參加下等艙的舞會、為她畫像,二人的感情逐漸公升溫。\n \n \u3000\u30002023年4月14日,星期天晚上,乙個風平浪靜的夜晚。鐵達尼號撞上了冰山,「永不沉沒的」鐵達尼號面臨沉船的命運,羅絲和傑克剛萌芽的愛情也將經歷生死的考驗。\n '

##方法一:注意匯入 import re

#採用的是sub替換

resultstr = re.sub(r' ','',re.sub(r'\u3000','',re.sub(r'\n','',str)))

print(resultstr)

##方法二:

#採用的是replace替換

resultstr = str.replace(' ','').replace('\n','').replace('\u3000','')

print(resultstr)

##方法三:

# 採用的是split()直接去除特殊字元

resultstr = "".join(str.split())

print(resultstr)

##方法四:

# 採用的是translate去除特殊字元,move裡面 '\n\u3000 '是需要切掉的字元

move = dict.fromkeys((ord(c) for c in u'\n\u3000 '))

resultstr = str.translate(move)

print(resultstr)

各位按需索取吧,執行結果:

2023年4月10日,號稱「世界工業史上的奇蹟」的豪華客輪鐵達尼號開始了自己的**航,從英國的南安普頓出發駛往美國紐約。富家少女羅絲(凱特•溫絲萊特)與母親及未婚夫卡爾坐上了頭等艙;另一邊,放蕩不羈的少年畫家傑克(萊昂納多·迪卡普里奧)也在碼頭的一場賭博中贏得了下等艙的船票。羅絲厭倦了上流社會虛偽的生活,不願嫁給卡爾,打算投海自盡,被傑克救起。很快,美麗活潑的羅絲與英俊開朗的傑克相愛,傑克帶羅絲參加下等艙的舞會、為她畫像,二人的感情逐漸公升溫。2023年4月14日,星期天晚上,乙個風平浪靜的夜晚。鐵達尼號撞上了冰山,「永不沉沒的」鐵達尼號面臨沉船的命運,羅絲和傑克剛萌芽的愛情也將經歷生死的考驗。

sqlServer去除欄位中的中文

很多時候資料庫表中某些欄位是由中文和字母或數字組成,但有時我們又需要將字段中的中文去掉。想要實現這種需求的方法有很多,下面就是其中一種解決方法。首先我們先建立測試資料 create table test id int primary key identity 1,1 name varchar 20 ...

去除XML標籤提取內容以及去除內容中的特殊字元

昨天弄的xml除了dtd的問題之後,還有兩個問題,乙個是xml標籤的內容裡面還有標籤,例如 我有2本書。乙個是內容裡面有特殊字元,譬如 這本書主要說 冒險 勵志。這兩種情況存在的前提下,我要是用來作為檔名稱生成檔案時必然報錯,所以先要料理掉這兩個畔腳石。1 去除xml標籤內容中的標籤,值提取內容 s...

sql中擷取字段資料的函式

今天遇到乙個做模糊查詢的問題,做模糊查詢時,要將做模糊查詢的資料第乙個數字給擷取掉。之前想在service中用for 迴圈 用startswith 做篩選,方案沒有通過,然後上網上搜取sql相關函式,找到了乙個方法 1 left s,n 函式返回字串s開始的最左邊n個字元。eg select lef...