Любой статистический тест, чтобы получить понимание данных - ведет ли более высокая цена к лучшему качеству? - PullRequest
0 голосов
/ 25 марта 2020

У меня есть следующий набор данных. Цена (3: самая высокая); Рейтинг качества (4: лучший, 0: patheti c); obs (количество людей, которые дали данный рейтинг для данного уровня цены)

Вопросы:

Я хочу проверить свою гипотезу о том, что цена связана с рейтингом положительно. Какой тест даст мне этот результат?

Какие хорошие визуализации я могу создать из этого теста, используя Python

Данные могут быть взяты из следующей ссылки, так как данные ниже не могут прийти в правильном формате

http://users.stat.ufl.edu/~winner/data/pricequal.dat

price   rating  obs

0 3 0 4 1 2 0 1 2 1 0 4 3 3 1 8 4 2 1 21 5 1 1 20 6 3 2 26 7 2 2 22 8 1 2 23 9 3 3 15 10 2 3 12 11 1 3 9 12 3 4 7 13 2 4 4 14 1 4 4

1 Ответ

0 голосов
/ 25 марта 2020

Итак, вы хотите оценить, соответствует ли price значению rating. Существует много статистических методов для оценки корреляции, и вам, возможно, было бы лучше поискать Перекрестная проверка в этом отношении.

Поскольку у вас, по-видимому, есть «категоричные» данные (т. Е. Рейтинги находятся в категориях не в непрерывном масштабе), я бы рекомендовал использовать ранг корреляции Спирмена . Полученное значение r описывает, насколько хорошо две переменные соотносятся друг с другом.

В python вы могли бы достичь этого с помощью:

from scipy.stats import spearmanr

p, r = spearmanr(x, y)  # x and y are your data

Чтобы знать, «насколько повышается рейтинг в зависимости от цены», вам необходимо изучить прогностические модели, такие как линейная регрессия.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...