Визуализация данных с целью очистки данных - PullRequest
0 голосов
/ 05 ноября 2018

У меня есть столбец фрейма данных с миллионами строк (почти 8 миллионов). Я хочу исследовать этот столбец, чтобы провести некоторую очистку данных. Содержащиеся данные - это trip_distance желтых такси Нью-Йорка. Я пробовал простой график с sns.distplot(), но он не дает мне четкого графика.

enter image description here

Я тоже пытался использовать диапазон: sns.distplot(df['trip_distance']<200, kde=False, bins=10, norm_hist=False), но я получил это, что опять же не выглядит полезным:

enter image description here

Есть ли способ понять этот столбец с помощью визуализации?

1 Ответ

0 голосов
/ 05 ноября 2018

Вы можете попробовать это: ->

import pandas as pd
import matplotlib.pyplot as plt
s=pd.read_csv("name.csv",usecols=['col_name'],squeeze=True)
s.plot.bar() #for bar graph
s.plot.hist() #for histogram
...