Как найти расстояние между 2 векторами, где некоторые поля являются строками (Name, Address et c), а другие - числом - PullRequest
0 голосов
/ 31 января 2020

Я должен найти расстояние между 2 записями. Каждая запись представляет собой вектор из нескольких полей. Некоторые из этих полей: Numeri c. Другие строки. Как я могу придумать одно значение для расстояния.

Я могу индивидуально рассчитать расстояние строки для каждой строковой переменной и евклидово расстояние для чисел c единиц. В таком случае, как мне объединить оба значения расстояния

1 Ответ

3 голосов
/ 31 января 2020

Это действительно зависит от того, что вы пытаетесь сделать. Например, вместо того, чтобы находить расстояние между строками, которые являются адресами, возможно, стоит потратить время на то, чтобы преобразовать их в географические местоположения и измерить их расстояние.

Поиск расстояния между строками имен на самом деле не имеет смысла, но вы можно найти расстояние между строками и использовать некоторые веса, чтобы они не делали числовые значения неэффективными.

По существу вам потребуется какой-то тип извлечения признаков предварительной обработки для ваших текстовых данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...