Поиск имени в кадре данных (оно может иметь одинаковое произношение, быть написано с ошибкой и т. Д. c.) - PullRequest
0 голосов
/ 06 февраля 2020

У меня есть фрейм данных (1 м строк), и мне нужно найти конкретное имя в этом фрейме (оно может иметь одинаковое произношение, быть написано с ошибкой и т. Д. c.). Я думаю о том, чтобы генерировать различные оценки (soundex, расстояние Левенштейна, нечеткие оценки). Проблема в том, как мне сравнить показатель soundex в 1 миллион значений с конкретным значением soundex (например, U312).

...