Предположим, у меня есть список таких видов спорта:
sports=["futball","fitbal","football","tennis","tenis","tenisse","footbal","zennis","ping-pong"]
Я хотел бы создать информационный фрейм, который будет соответствовать каждому элементу спорта с наиболее близким значением, если нечеткое соответствие превышает 0,5, и если оно не просто сопоставляет его с самим собой. (Я хочу использовать для этого функцию fuzzywuzzy.fuzz.ratio (x, y))
Результат должен выглядеть следующим образом:
pd.DataFrame({"sport":sports,"closest_match":["futball","futball","football","tennis","tennis","tennis","futball","tennis","ping-pong"]})
sport closest_match
0 futball futball
1 fitbal futball
2 football football
3 tennis tennis
4 tenis tennis
5 tenisse tennis
6 footbal futball
7 zennis tennis
8 ping-pong ping-pong
Спасибо