Как реализовать собственный компаратор в библиотеке Python Dedupe? - PullRequest
0 голосов
/ 12 октября 2019

Я до сих пор использую великолепную библиотеку Dedupe , чтобы помочь связать записи от нескольких провайдеров. Одно из полей, которые я сравниваю, это поле номера телефона. Я хотел бы использовать библиотеку телефонных номеров Google для нормализации этих телефонных номеров. Еще одна приятная функциональность - это возможность сравнивать числа и возвращать тип соответствия от 0 (совсем не совпадение) до 4 (каждый компонент соответствует точно).

Так что это похоже наестественная посадка для пользовательской переменной Дедупе . Но я немного озадачен тем, как должна выглядеть реализация пользовательского компаратора. Пример в документации - это просто 0 против 1 для совпадения / несовпадения.

Я в основном хочу убедиться, что мой закадровый компаратор покажет Dedupe, что 4 означает, что телефонные номера очень близки, а 0 означает, что они очень далеко друг от друга.

Будет ли это работать? Или я должен вернуть это другим способом? Например, нужно ли указывать точное совпадение с 0?

...