Я работаю с набором элементов видео с YouTube.Эти видео имеют такие функции, как количество комментариев или длина заголовка.Некоторые, но не все из них имеют средний рейтинг или нравится и не нравится.Чтобы сделать качественное утверждение о них, я посмотрел на соотношение между основными утверждениями о качестве истины и другими характеристиками.Оказывается, есть некоторые существенные корреляции, например, количество комментариев коррелирует со средней оценкой.Таким образом, я могу предположить, что количество комментариев к видеофильму его качества не соответствует.
Пример из SciPy (представьте x1
и x2
как comment_count
и rating_average
):
>>> x1 = [12, 2, 1, 12, 2]
>>> x2 = [1, 4, 7, 1, 0]
>>> tau, p_value = sp.stats.kendalltau(x1, x2)
>>> tau
-0.47140452079103173
>>> p_value
0.24821309157521476