Поиск почти одинакового имени файла с помощью python - PullRequest
0 голосов
/ 04 февраля 2020

Я пытаюсь найти два одинаковых имени файла в папке. Например, папка может содержать red_apple и red_apple или green_man go и зеленые манго. Но может случиться так, что в этой папке будет только один файл, такой как green man go или red_apples. Как я могу проверить, содержит ли моя папка такой похожий файл?

1 Ответ

1 голос
/ 04 февраля 2020

Вы ищете термин Fuzzy Matching. Есть пара хороших библиотек, которые помогут вам в этом. Одним из них является FuzzyWuzzy

. Идеальным способом было бы иметь список потенциальных совпадений, а затем использовать любую из нечетких библиотек, чтобы найти наиболее близкое совпадение. Обычно эти библиотеки дают вам соотношение того, насколько близко введенное слово находится к любому из слов в списке.

Вы можете проверить пример FuzzyWuzzy в репозитории Github или здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...