多個界定符分割字串

2021-08-20 13:44:23 字數 1516 閱讀 3381

你需要將乙個字串分割為多個字段,但是分隔符(還有周圍的空格)並不是固定的。

string物件的split()方法只適應於非常簡單的字串分割情形, 它並不允許有多個分隔符或者是分隔符周圍不確定的空格。 當你需要更加靈活的切割字串的時候,最好使用re.split()方法:

>>> line = 'asdf fjdk; afed, fjek,asdf, foo'

>>>

import re

>>> re.split(r'[;,\s]\s*', line)

['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

函式 re.split() 是非常實用的,因為它允許你為分隔符指定多個正則模式。 比如,在上面的例子中,分隔符可以是逗號,分號或者是空格,並且後面緊跟著任意個的空格。 只要這個模式被找到,那麼匹配的分隔符兩邊的實體都會被當成是結果中的元素返回。 返回結果為乙個字段列表,這個跟str.split()返回值型別是一樣的。

當你使用 re.split() 函式時候,需要特別注意的是正規表示式中是否包含乙個括號捕獲分組。 如果使用了捕獲分組,那麼被匹配的文字也將出現在結果列表中。比如,觀察一下這段**執行後的結果:

>>> fields = re.split(r'(;|,|\s)\s*', line)

>>> fields

['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']

>>>

獲取分割字元在某些情況下也是有用的。 比如,你可能想保留分割字串,用來在後面重新構造乙個新的輸出字串:

>>> values = fields[::2]

>>> delimiters = fields[1::2] + ['']

>>> values

['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

>>> delimiters

[' ', ';', ',', ',', ',', '']

>>>

# reform the line using the same delimiters

>>>

''.join(v+d for v,d in zip(values, delimiters))

'asdf fjdk;afed,fjek,asdf,foo'

>>>

如果你不想保留分割字串到結果列表中去,但仍然需要使用到括號來分組正規表示式的話, 確保你的分組是非捕獲分組,形如 (?:…) 。比如:

>>> re.split(r'(?:,|;|\s)\s*', line)

['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

>>>

2 1使用多個界定符分隔字串

問題 你需要將乙個字串分割為多個字段,但是分隔符 還有周圍的空格 並不是固定的。解決方案 string物件的split 方法只適用於非常簡單的字串分割情形,它並不允許有多個分隔符或者是分隔符周圍不確定的的空格。當你需要新增更靈活的切割字串的時候,最好使用re.split 方法 import re l...

1989 字串分割

time limit 1 s memory limit 32 mb submission 241 ac 75 score 19.88 submit status alex的好朋友都去生猴子了,所以她只好百無聊賴地繼續玩字串遊戲。輸入乙個長度不超過10000的字串,字串中只含字母和空格,空格用於分隔單...

C 字串分割,包括分割多個字元

1 如果字串格式為 string str abc def hijkl mn string s str.split new char string s str.split eval eval 重點是split中的函式是字元型,不是字串 結果就是 s 0 abc s 1 def s 2 hijkl s ...