Оценка процентилей в искаженном распределении (не нужно быть точным) - PullRequest
0 голосов
/ 05 ноября 2019

Это может быть больше вопрос статистики, и я хотел бы найти решение с помощью Excel. Я бы предпочел использовать простой VBA, если необходимо какое-либо кодирование.

Есть ли способ оценить процентиль конкретной точки данных в искаженном распределении? Мне не нужны точные процентили, а нужна только разумная оценка. Я работаю над анализами, основанными на средневзвешенных контрольных показателях, о которых сообщают несколько источников. Все мои источники сообщают о 25-м, 50-м, 75-м и 90-м процентилях, а также о среднем и стандартном отклонении. Мы используем эти критерии для определения целевого диапазона, и наша цель состоит в том, чтобы результаты конкретного анализа оказались где-то в опубликованных процентилях. Меня часто просят указать, в каком процентиле находится наш конкретный результат, и все, что я могу предоставить, это широкие диапазоны, например 25-50 и т. Д. Поэтому меня просят использовать простую экстраполяцию для определения конкретного процентиля конкретного результата. и я знаю, что использование этого метода является неточным.

Среднее и медианное значение отличаются в 99% случаев в моем наборе данных, но разница в среднем между средним и медианным в% составляет всего 6%. Только около 10% случаев имеют среднее значение и медиану с разницей более 10%.

Могу ли я предположить нормальное распределение для 90% случаев с относительно низкой разницей в процентах между средним и медианным значением?

Могу ли я сделать предположение, которое поможет мне оценить более точно, в случаях с более высокой разницей в процентах между средним и средним? Я мог бы для этих случаев просто использовать нормальное распределение и отправить мою оценку процентиля вместе с примечанием, указывающим, что оценка, вероятно, отклонена в том или ином направлении, но я бы лучше дал лучшую оценку.

Ответ на cybernetic.nomad:

Во-первых, спасибо за комментарии! Во-вторых, это не похоже на работу. Я думаю, что у меня недостаточно данных. Прикрепленное изображение показывает пример. Первые 5 строк показывают один набор моих средневзвешенных тестов для одного случая. Ниже я добавил две строки - одну с моей «целевой» суммой. Это может быть любое число, но, чтобы проверить предложенную вами формулу, я ввел средневзвешенное значение для 50-го процентиля. В строке ниже приведены результаты формулы =centrank.exc (25: 90, цель). Результат должен быть 0,5, но это не так, поэтому я не думаю, что это работает. пример

...