Как бы вы интерпретировали этот разброс? - PullRequest
0 голосов
/ 12 февраля 2019

Я собираю некоторые данные из базы данных фильмов.Я сделал график среднего пользовательского голосования против бюджета.Ось х в 100 000 000 долларов.Мне кажется, что есть положительная корреляция между бюджетом и рейтингом по бюджетам свыше 100 000 000 долларов.Проблема, которую я вижу, состоит в том, что существует слишком много точек данных между 0 и 100 000 000, которые находятся повсюду.Я делаю этот анализ данных через панд, поскольку я изучаю статистику и панд.Любые предложения о том, как очистить эти данные дальше?

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...