Levenshtein 計算編輯距離

2022-04-28 14:24:08 字數 455 閱讀 3125

levenshtein 距離,又稱編輯距離,指的是兩個字串之間,由乙個轉換成另乙個所需的最少編輯操作次數。編輯操作包括將乙個字元替換成另乙個字元,插入乙個字元,刪除乙個字元。(即:插入、刪除、替換)。

(1)首先安裝python-levenshtein庫,安裝完使用import levenshtein匯入該庫。

(2)定義兩個字串str1, str2,然後通過levenshtein.distance(str1, str2) 計算編輯距離distance。

import

levenshtein

str1 = '

mike

'str2 = '

micheal

'distance = levenshtein.distance(str1, str2) #

distance指編輯距離

print(distance)

編輯距離演算法(Levenshtein)

編輯距離定義 編輯距離,又稱levenshtein距離,是指兩個字串之間,由乙個轉成另乙個所需的最少編輯操作次數。例如將eeba轉變成abac eba 刪除第乙個e aba 將剩下的e替換成a abac 在末尾插入c 所以eeba和abac的編輯距離就是3 俄羅斯科學家vladimir levens...

levenshtein字串編輯距離演算法

指的是字串a向字串b轉換的最小步數。比如字串 abc 轉換成 a 最少需要刪除 b c 兩個字元。字串操作有三種,乙個是新增插入,乙個是刪除,乙個是替換。該演算法最早由 levenshtein提出。從a字串向b字串轉換,最重要的是考慮不要重複操作,比如 abd 轉換成 abcd 只需要插入乙個 c ...

levenshtein 距離 python實現

參考了部落格 import numpy as np 此為編輯距離,就是str1轉化為str2的編輯距離 採用的就是動態規劃思想 舉例說明,我們以 str1 leensh str2 levensh 為例,首先得到的結果為 l e v e n s h 0.1.2.3.4.5.6.7.l 1.0.1.2....