Я собираю некоторые данные из базы данных фильмов.Я сделал график среднего пользовательского голосования против бюджета.Ось х в 100 000 000 долларов.Мне кажется, что есть положительная корреляция между бюджетом и рейтингом по бюджетам свыше 100 000 000 долларов.Проблема, которую я вижу, состоит в том, что существует слишком много точек данных между 0 и 100 000 000, которые находятся повсюду.Я делаю этот анализ данных через панд, поскольку я изучаю статистику и панд.Любые предложения о том, как очистить эти данные дальше?