大資料分析Python正規表示式有哪些

2021-10-25 09:54:34 字數 2054 閱讀 1850

此正規表示式備忘單基於python 3的正規表示式文件。

如果您對學習python感興趣,我們可以免費提供互動式的初學者和中級python程式設計課程。

大資料分析的正規表示式(pdf)

特殊的角色

^| 在字串的開頭匹配表示式右側。它匹配\n字串中每個這樣的例項。

$| 將表示式匹配到字串末尾的左側。它匹配\n字串中每個這樣的例項。

.| 匹配除行終止符(如)以外的任何字元\n。

\| 轉義特殊字元或表示字元類。

a|b| 匹配表示式a或b。如果a先匹配,b則不試。

+| 貪婪地匹配表示式左側1次或多次。

*| 貪婪地將表示式左對齊0次或多次。

?| 貪婪地將表示式左對齊0或1次。但是,如果?將其新增到限定詞(+,*和?本身)中,它將以非貪婪的方式執行匹配。

| 將表示式匹配到其剩餘m時間,且不少於該時間。

| 將表示式的左邊m與n時間匹配,而不是更少。

?| 將表示式匹配到其剩餘m時間,並忽略n。見?上文。

字元類(又名特殊序列)

\w| 匹配字母數字字元,該裝置a-z,a-z和0-9。它還與下劃線匹配_。

\d| 匹配數字,表示0-9。

\d| 匹配任何非數字。

\s| 匹配空白字元,其中包括\t,\n,\r,和空格字元。

\s| 匹配非空格字元。

\b| 在單詞的開頭和結尾(即\w和之間)匹配邊界(或空字串)\w。

\b| 匹配\b不匹配的地方,即\w字元的邊界。

\a| 無論是單行還是多行模式,都在字串的絕對開頭處將表示式與右側匹配。

\z| 無論是單行還是多行模式,都將表示式與字串的絕對結尾處的左側匹配。

套裝[ ]| 包含一組要匹配的字元。

[amk]| 匹配要麼a,m或k。不匹配amk。

[a-z]| 匹配從a到的任何字母z。

[a\-z]| 匹配a,-或z。-之所以匹配是因為\逃脫了它。

[a-]| 與a或匹配-,因為-未用於表示一系列字元。

[-a]| 如上所述,匹配a或-。

[a-z0-9]| 從匹配的字元a來z,也從0到9。

[(+*)]| 特殊字符集內成為常量,因此本場比賽(,+,*,和)。

[^ab5]| 新增^不包括集合中的任何字元。在這裡,它匹配不在字元a,b或5。

團體( )| 匹配括號內的表示式並將其分組。

(? )| 這樣的括號內,?作為擴充套件符號。其含義取決於其右邊的字元。

(?pab)| 匹配表示式ab,並且可以使用組名進行訪問。

(?ailmsux)| 這裡a,i,l,m,s,u,和x一些標誌:

1)a —僅匹配ascii

2)i —忽略大小寫

3)l —取決於語言環境

4)m —多線

5)s —全部匹配

6)u —匹配unicode

7)x —詳細

(?:a)| 匹配由表示的表示式a,但與不同的是(?pab),以後無法檢索它。

a(?=b)| 前瞻性斷言。a僅當其後跟時,此表示式才匹配b。

a(?!b)| 否定超前斷言。a僅當表示式不後跟時,此表示式才匹配b。

(?<=b)a| 斷言肯定。a僅當表示式b緊靠其左側時,它才與表示式匹配。這只能匹配固定長度的表示式。

(?p=name)| 匹配與名為「 name」的早期組匹配的表示式。

(...)\1| 該數字1對應於要匹配的第乙個組。如果我們要匹配同一表示式的更多例項,只需使用其數字而不是再次寫出整個表示式。我們可以從使用1多達99這些群體及其相應的編號。

流行的python re模組功能

re.findall(a, b)| 匹配a字串中表示式的所有例項,b並在列表中返回它們。

re.search(a, b)| 匹配a字串中表示式的第乙個例項b,並將其作為重新匹配物件返回。

re.split(a, b)| 使用定界符將字串b拆分為列表a。

re.sub(a, b, c)| 替換a用b的字串c。

摘自:

python 資料分析 正規表示式

正規表示式就是記錄文字規則的 我們將從正規表示式基礎和re模組實現兩個方面來說 python提供了re模組,用於實現正規表示式的操作。在實現時,可以使用re模組提供的方法,如search match findall 進行字串處理,也可以使用re模組的compile 方法將模式字串轉換為正規表示式物件...

Python大資料分析 開篇

python大資料分析 開篇 目前在網上看了很多部落格,都是一些關於資料處理的,且都淺嘗輒止,沒有形成乙個系列,只言片語,不能給人以更深層次的啟發。加之,最近在用python做金融大資料這塊的分析,故寫部落格以記之,以供他人閱,相互交流。大資料分析的意義,我自不用多述。眾多金融公司,無不在挖掘其價值...

python大資料分析 Matplotlib庫

matplotlib作圖基本 import numpy as np import matplotlib.pyplot as plt x np.linspace 0,10,1000 x軸的自變數 y np.sin x 1 函式 z np.cos x 2 1 函式 plt.figure figsize ...