Python拼接字串的七種方式

2021-09-19 20:24:01 字數 4472 閱讀 8222

忘了在哪看到一位程式設計大牛調侃,他說程式設計師每天就做兩件事,其中之一就是處理字串。相信不少同學會有同感。

幾乎任何一種程式語言,都把字串列為最基礎和不可或缺的資料型別。而拼接字串是必備的一種技能。今天,我跟大家一起來學習python拼接字串的七種方式。

1、來自c語言的%方式

print('%s %s' % ('hello', 'world'))

>>> hello world

%號格式化字串的方式繼承自古老的c語言,這在很多程式語言都有類似的實現。上例的%s是乙個佔位符,它僅代表一段字串,並不是拼接的實際內容。實際的拼接內容在乙個單獨的%號後面,放在乙個元組裡。

類似的佔位符還有:%d(代表乙個整數)、%f(代表乙個浮點數)、%x(代表乙個16進製制數),等等。%佔位符既是這種拼接方式的特點,同時也是其限制,因為每種佔位符都有特定意義,實際使用起來太麻煩了。

2、format()拼接方式

# 簡潔版

s1 = 'hello {}! my name is {}.'.format('world', 'python貓')

print(s1)

>>>hello world! my name is python貓.

# 對號入座版

s2 = 'hello ! my name is .'.format('world', 'python貓')

s3 = 'hello ! my name is .'.format(name1='world', name2='python貓')

print(s2)

>>>hello world! my name is python貓.

print(s3)

>>>hello world! my name is python貓.

這種方式使用花括號{}做佔位符,在format方法中再轉入實際的拼接值。容易看出,它實際上是對%號拼接方式的改進。這種方式在python2.6中開始引入。

上例中,簡潔版的花括號中無內容,缺點是容易弄錯次序。對號入座版主要有兩種,一種傳入序列號,一種則使用key-value的方式。實戰中,我們更推薦後一種,既不會數錯次序,又更直觀可讀。

3、() 類似元組方式

s_tuple = ('hello', ' ', 'world')

s_like_tuple = ('hello' ' ' 'world')

print(s_tuple)

>>>('hello', ' ', 'world')

print(s_like_tuple)

>>>hello world

type(s_like_tuple) >>>str

注意,上例中s_like_tuple並不是乙個元組,因為元素間沒有逗號分隔符,這些元素間可以用空格間隔,也可以不要空格。使用type()檢視,發現它就是乙個str型別。我沒查到這是啥原因,猜測或許()括號中的內容是被python優化處理了。

這種方式看起來很快捷,但是,括號()內要求元素是真實字串,不能混用變數,所以不夠靈活。

# 多元素時,不支援有變數

str_1 = 'hello'

str_2 = (str_1 'world')

>>> syntaxerror: invalid syntax

str_3 = (str_1 str_1)

>>> syntaxerror: invalid syntax

# 但是下面寫法不會報錯

str_4 = (str_1)

4、物件導向模板拼接

from string import template

s = template('$ $!')

print(s.safe_substitute(s1='hello',s2='world'))

>>> hello world!

說實話,我不喜歡這種實現方式。濃濃的一股被物件導向思想毒害的臭味。

就不多說了。

5、常用的+號方式

str_1 = 'hello world! ' 

str_2 = 'my name is python貓.'

print(str_1 + str_2)

>>>hello world! my name is python貓.

print(str_1)

>>>hello world!

這種方式最常用、直觀、易懂,是入門級的實現方式。但是,它也存在兩處讓人容易犯錯的地方。

首先,新入門程式設計的同學容易犯錯,他們不知道字串是不可變型別,新的字串會獨佔一塊新的記憶體,而原來的字串保持不變。上例中,拼接前有兩段字串,拼接後實際有三段字串。

其次,一些有經驗的老程式設計師也容易犯錯,他們以為當拼接次數不超過3時,使用+號連線符就會比其它方式快(ps:不少python教程都是如此建議),但這沒有任何合理根據。

事實上,在拼接短的字面值時,由於cpython中的 常數摺疊 (constant folding)功能,這些字面值會被轉換成更短的形式,例如'a'+'b'+'c' 被轉換成'abc','hello'+'world'也會被轉換成'hello world'。這種轉換是在編譯期完成的,而到了執行期時就不會再發生任何拼接操作,因此會加快整體計算的速度。

常數摺疊優化有乙個限度,它要求拼接結果的長度不超過20。所以,當拼接的最終字串長度不超過20時,+號操作符的方式,會比後面提到的join等方式快得多,這與+號的使用次數無關。

題外話:你是否覺得20這個數字很熟悉呢?沒錯,字串類的特權種族也是以20為限。當時也有乙個例子,展示了編譯期和執行期的區別,建議你去回看。

6、join()拼接方式

str_list = ['hello', 'world']

str_join1 = ' '.join(str_list)

str_join2 = '-'.join(str_list)

print(str_join1) >>>hello world

print(str_join2) >>>hello-world

str物件自帶的join()方法,接受乙個序列引數,可以實現拼接。拼接時,元素若不是字串,需要先轉換一下。可以看出,這種方法比較適用於連線序列物件中(例如列表)的元素,並設定統一的間隔符。

當拼接長度超過20時,這種方式基本上是首選。不過,它的缺點就是,不適合進行零散片段的、不處於序列集合的元素拼接。

7、f-string方式

name = 'world'

myname = 'python_cat'

words = f'hello . my name is .'

print(words)

>>> hello world. my name is python_cat.

f-string方式出自pep 498(literal string interpolation,字面字串插值),從python3.6版本引入。其特點是在字串前加 f 標識,字串中間則用花括號{}包裹其它字串變數。

這種方式在可讀性上秒殺format()方式,處理長字串的拼接時,速度與join()方法相當。

儘管如此,這種方式與其它某些程式語言相比,還是欠優雅,因為它引入了乙個 f 標識。而其它某些程式語言可以更簡練,比如shell:

name="world"

myname="python_cat"

words="hello $. my name is $."

echo $words

>>>hello world. my name is python_cat.

總結一下,我們前面說的「字串拼接」,其實是從結果上理解。若從實現原理上劃分的話,我們可以將這些方法劃分出三種型別:

格式化類:%、format()、template

拼接類:+、()、join()

插值類:f-string

當要處理字串列表等序列結構時,採用join()方式;拼接長度不超過20時,選用+號操作符方式;長度超過20的情況,高版本選用f-string,低版本時看情況使用format()或join()方式。

one more thing:

我的風格是發散思考、系統思考、以及追求程式設計哲學的思考。

最近,我在讀《黑客與畫家》,保羅•格雷厄姆在書中提出了這個問題:

從語義上看,字串或多或少可以理解成列表的乙個子集,其中的每乙個元素都是字元。那麼,為什麼還需要把字串單列為一種資料結構呢?

作者認為「程式語言設定字串似乎就是乙個過早優化的例子」,這個觀點令我大為震撼!前文提到的七種拼接字串的方法瞬間變成紙,薄得似乎一觸就破。

但是,作者認為這還不夠,他還有更驚人想法:

還有比這更驚人的預言。在邏輯上其實不需要對整數設定單獨的表示法,因為可以把它們也看作列表,整數n可以用乙個n元素的列表表示。… 程式語言會發展到放棄基本資料型別之一的整數這一步嗎?

不知道你讀完這段話,有何感想。我在閱讀時,雖然有上下文語境的鋪墊,還是驚嘆不已。

拼接數字 Python中字串拼接的三種方式

在python中,我們經常會遇到字串的拼接問題,在這裡我總結了三種字串的拼接方式 1.使用加號 號進行拼接 加號 號拼接是我第一次學習python常用的方法,我們只需要把我們要加的拼接到一起就行了,不是變數的使用單引號或雙引號括起來,是變數直接相加就可以,但是我們一定要注意的是,當有數字的時候一定要...

教大家玩轉Python字串處理的七種技巧

前言 日常使用python經常要對文字進行處理,無論是爬蟲的資料解析,還是大資料的文字清洗,還是普通檔案的處理,都是要用到字串.python對字串的處理內建了很多高效的函式,非常方便功能很強大.下面是我程式設計客棧總結的常用的7招,有了這幾招就能輕鬆應對字串處理.一 字串的連線和合併 連線 lhni...

python 字串拼接

閱讀目錄 1.加號 2.逗號 3.直接連線 4.格式化 5.join 6.多行字串拼接 回到頂部 示例版本為py2 回到頂部 第一種,有程式設計經驗的人,估計都知道很多語言裡面是用加號連線兩個字串,python裡面也是如此直接用 來連線兩個字串 print python tab 結果 pythont...