У меня есть целевая аудитория или выборка (S) из группы (P), из которой я должен расширить свою целевую аудиторию.
Образец может быть случайным или концентрированным. Если возможно, мне также нужен некоторый параметр подобия, такой как этот пользователь,% похож на образец.
Мой подход -
Я вычисляю расстояние по махалонобису от распределения S для каждой записи в наборе P-S (поскольку он вычисляет, сколько стандартного отклонения составляет моя точка x от распределения s)
По которым я ранжирую пользователей.
Это правильный подход или кто-то может предложить мне лучший метод?
В моей базе данных есть функции для каждого пользователя (включая такие категориальные значения, как мужской / женский и т. Д.)
И все данные нормализованы. (0-1) плавает