Проверка сходства строк с использованием числовых значений - PullRequest
0 голосов
/ 30 октября 2018

Мне было интересно, как лучше вычислить число представление строки так, что похожие строки будут иметь одинаковые представления / числовые значения. Например: «ABCDE» -> 80759, «ABCDF» -> 80763, но избегайте таких случаев, как: ZBCDE-> 2680805, ABCDE-> 180805 или: ZBCD-> 268080, ZBCDE-> 2680805, где цифры резко меняются при изменении только одна буква или когда буква сброшена, но кроме того, строки очень близки / совпадают.

Обратите внимание: я не хочу сравнивать две строки, используя расстояние Левенштейна или каким-либо другим способом, но вычислять представляющее число для строки, которая будет похожа или, по крайней мере, не изменится радикально на / из число, сгенерированное для другой строки, если обе исходные строки похожи. Я хочу, чтобы число было достаточно маленьким, если это возможно.

Спасибо!

...