PythonはLevenshteinの距離類似度の計算を実現


Levenshtein距離
1.定義
Levenshtein距離は、編集距離とも呼ばれ、2つの文字列の間で、1つから別のものに変換するのに必要な最小限の編集操作回数を指す.編集操作には、1つの文字を別の文字に置き換え、1つの文字を挿入し、1つの文字を削除することが含まれます.(挿入、削除、置換)
 
2.コード実装
(1)まずpython-Levenshteinライブラリをインストールし、import Levenshteinを使用してライブラリをインポートします.
(2)2つの文字列str 1,str 2を定義し、Levenshtein.distance(str 1,str 2)は編集距離distanceを計算する.
import Levenshtein

str1 = 'Mike'
str2 = 'Micheal'
distance = Levenshtein.distance(str1, str2)  # distance     
print(distance)     # 4