Это действительно зависит от того, что вы пытаетесь сделать. Например, вместо того, чтобы находить расстояние между строками, которые являются адресами, возможно, стоит потратить время на то, чтобы преобразовать их в географические местоположения и измерить их расстояние.
Поиск расстояния между строками имен на самом деле не имеет смысла, но вы можно найти расстояние между строками и использовать некоторые веса, чтобы они не делали числовые значения неэффективными.
По существу вам потребуется какой-то тип извлечения признаков предварительной обработки для ваших текстовых данных.