Как отформатировать грязный набор данных? - PullRequest
0 голосов
/ 11 июля 2019

Текущий формат моей проблемы следующий:

, где 'HOODNUM', 'HOODNAM', 'ENUM_FSA' , 'Unnamed:1' - столбцы.

Моя цель - отформатировать эти данные следующим образом:

HOODNUM   HOODNAM                     ZipCode
1         West Humber-Clairville .    M9V
1         West Humber-Clairville      M9W

Как я могу решить эту проблему с помощью Python?

Я пробовал

df = df.stack()
df = pd.DataFrame(data=df)

, что привело к:

HOODNUM  HOODNAME                                     
1        West Humber-Clairville      
                                            ENUM_FSA      M9V
                                            Unnamed: 1    M9W

с HOODNUM и HOODNAME являются индексами, но это не совсем тот формат, который я искал.

df = df.set_index(['HOODNUM','HOODNAME'])
df = df.stack()
df = pd.DataFrame(data=df)
...