Я пытался использовать функцию emdL1()
из пакета earthmovdist
для сравнения двух дистрибутивов. Входами для указанной функции являются два вектора x
и y
. Проблема в том, что я не знаю, должен ли я использовать исходный вектор значений как x
и y
или значения функции распределения плотности (например, density(x)$y
) для вычисления этого расстояния.
Я не смог найти больше информации по этой теме в интернете. В качестве примера рассмотрим эти два распределения:
Которые представляют собой сравнение двух сегментов по двум различным переменным. Результаты для EMD в первом случае - 626
и 673
соответственно, если выполняется код emdL1(x,y)
и 4522
и 1491
, если код выполняется emdL1(density(x)$y,density(y)$y)
.
Ясно, что результат противоположен, в зависимости от того, какой подход я выберу. Для меня было бы более разумно, чтобы первые распределения были более разными (парное t.test имеет значение <0,05), но я хотел бы понять, какой подход является правильным. </p>