Итак, вы хотите оценить, соответствует ли price
значению rating
. Существует много статистических методов для оценки корреляции, и вам, возможно, было бы лучше поискать Перекрестная проверка в этом отношении.
Поскольку у вас, по-видимому, есть «категоричные» данные (т. Е. Рейтинги находятся в категориях не в непрерывном масштабе), я бы рекомендовал использовать ранг корреляции Спирмена . Полученное значение r описывает, насколько хорошо две переменные соотносятся друг с другом.
В python вы могли бы достичь этого с помощью:
from scipy.stats import spearmanr
p, r = spearmanr(x, y) # x and y are your data
Чтобы знать, «насколько повышается рейтинг в зависимости от цены», вам необходимо изучить прогностические модели, такие как линейная регрессия.