Что такое тип функции расстояния для типов данных смешанного типа? - PullRequest
0 голосов
/ 07 апреля 2020

Уважаемые,

При кластеризации выбор функции расстояния, я думаю, зависит от типа данных. А что, если у нас есть смешанные типы данных типа ( непрерывный ) и категориальная (номинальная и / или порядковая) шкала и двоичная номинальная переменная ? Существует ли какая-либо направляющая линия для определенного типа функции c расстояния в этом случае? Если нет, то я хотел бы узнать, какой выбор подходит для двоичной именной переменной?

Спасибо, Шошо

1 Ответ

0 голосов
/ 08 апреля 2020

Книга Кауфмана и Руссиуу «Поиск групп в данных» охватывает приличный диапазон алгоритмов для различных типов данных и дает некоторые пояснения о том, что делать со смешанными типами переменных. Они включают информацию о двоичных переменных.

https://onlinelibrary.wiley.com/doi/book/10.1002/9780470316801

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...