измерить разницу между двумя распределениями - PullRequest
0 голосов
/ 24 сентября 2018

У меня есть вектор расстояния образца программы.Я пытаюсь определить, насколько они похожи.Я использовал евклидово расстояние между группами выборок (каждое значение принадлежит сегменту, мы сравниваем сегмент по сегментам), что прекрасно работает.Но существует слишком много сравнений, которые необходимо выполнить для большого количества образцов.

Мне было интересно, существует ли эффективный способ построения индекса для сравнения выборок.Образцы выглядят так -

Sample:1 = {25 0 17 3 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0}
Sample:2 = {25 1 16 2 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0}
Sample:3 = {25 3 16 2 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0}

1 Ответ

0 голосов
/ 24 сентября 2018

Существует много способов охарактеризовать «разницу между двумя распределениями».Конкретный и целевой ответ требует более подробной информации, например, о лежащем в основе распределении вероятности.

Все зависит от того, как вы определяете разницу между двумя распределениями.Чтобы дать вам две идеи:

  1. A Тест Колмогорова-Смирнова - это непараметрический тест, который измеряет «расстояние» между двумя кумулятивными / эмпирическими функциями распределения.
  2. Дивергенция Кульбака-Лейблера измеряет "расстояние" между двумя распределениями на языке теории информации как изменение энтропии.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...