Вопрос статистики - PullRequest
       21

Вопрос статистики

2 голосов
/ 13 ноября 2009

Предположим, я провожу опрос 10 человек, спрашивающих, оценивать ли фильм от 0 до 4 звезд. Допустимые ответы: 0, 1, 2, 3 и 4.

Среднее значение 2,0 звезды.

Как рассчитать достоверность (или неопределенность) в отношении этого рейтинга в 2.0 звезды? В идеале, я хотел бы, чтобы число от 0 до 1, где 0 представляет полную неопределенность, а 1 представляет полную достоверность.

Кажется очевидным, что случай, когда 10 человек выбирают (2, 2, 2, 2, 2, 2, 2, 2, 2, 2), будет наиболее верным, тогда как случай, когда 10 человек выбирают 0, 0, 0, 0, 0, 4, 4, 4, 4, 4) будет наименее определенным. (0, 1, 1, 2, 2, 2, 2, 3, 3, 4) будет где-то посередине.

Ответы [ 4 ]

6 голосов
/ 13 ноября 2009

Стандартное отклонение не имеет запрошенных свойств. Он равен нулю, когда каждый выбирает один и тот же ответ, и может быть таким же большим, как sqrt (40/9) = 2.11, когда пять нулей и пять четверок.

Я предлагаю вам использовать 1-stdev (x) / sqrt (40/9), который примет значение 1, когда все с этим согласны, и значение 0, если есть пять нулей и пять четверок.

3 голосов
/ 13 ноября 2009

Функция, которую вы ищете, - это стандартное отклонение .

Стандартные отклонения ваших трех примеров: 0 (что означает отсутствие отклонения), 2.1 (большое отклонение) и 1.15 (между ними). ​​

0 голосов
/ 23 февраля 2010

Вы должны подумать, является ли среднее значение подходящей статистикой для такого рода информации. т. е. оценивается ли фильм на 2 звезды вдвое лучше, чем фильм на 4 звезды?

Вам может быть лучше обслужено использование показателя процентили (например, медианы) для представления центральной тенденции и диапазона процентилей (например, IQR) для измерения «уверенности». Как и в ответах выше, достоверность будет наибольшей при значении 0, поскольку вы действительно измеряете отклонение от центральной тенденции.

Между прочим, опрос 10 человек слишком мал, чтобы выполнять значительный статистический анализ.

0 голосов
/ 13 ноября 2009

То, что вы хотите, называется стандартным отклонением .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...