Заполнение пустых наборов данных - PullRequest
0 голосов
/ 11 марта 2020

В настоящее время я работаю над проектом по науке о данных, в котором набор данных выглядит примерно так:

Пример набора данных:

enter image description here

Когда я очищаю набор данных, я замечаю, что первые 4 значения в первом столбце (1,2,3,5) имеют одинаковую «область исправлений» 2500 и одинаковы для остальных , Но набор данных, который мне дали, помещает «Область исправлений» только в первый ряд категории. Есть ли способ, где я могу заполнить пустые ячейки соответствующей им областью, чтобы она выглядела следующим образом:

Я создал эту диаграмму с уценкой, поэтому я не знаю, как ее кодировать.

enter image description here

Ответы [ 2 ]

0 голосов
/ 11 марта 2020

Вы можете сделать это, чтобы выполнить столбец на основе условия

df = pandas.read_csv('your_file.csv')
df.loc[df['Patch Area'] == '', 'Patch Area'] = 2500

Здесь написано for all value in 'Patch Area', select empty value, and set 2500

0 голосов
/ 11 марта 2020

Вы можете попробовать с помощью pandas:

d = pandas.read_csv('your_file.csv')
d.fillna(method='ffill', inplace=True)
d.to_csv('new_file.csv', index=False)

"По сути, это просто заполняет пустые ячейки в каждом столбце самым последним действительным значением."

Ответ взят из { ссылка }

...