У меня есть файл Excel в этом формате, и я пытаюсь прочитать его в Pandas и очистить его:
Я прочитал вфайл с read_excel и создал многоиндексный уровень, начиная со строки 7 ([2013,2016,2017 ...]
df= pd.read_excel(PATH_CY_TABLE, header= [7,8,9])
Вот как это читается в:
В идеале я хочу привести в порядок что-то вроде этого:
Какие шаги я могу выполнить, чтобыполучить этот формат? Несколько вещей, которые я пробовал: 1. удалить уровень 1 мультииндекс: где имена столбцов отображаются как «безымянный ...»
df.columns= df.columns.get_level_values(1)
Это дает мне ошибку: IndexError: Слишком много уровней: у Index только 1 уровень, а не 2
Стекирование индексов столбцов:
df.stack()
Это дает мне ошибку: Ошибка типа:>> не поддерживается между экземплярами 'str' и 'INT '
Я пробовал это:
df.columns=df.columns.get_level_values(0)
И это дало мне первый уровень MultiIndex, как [2013, 2013, 2013, 2016,2016,2016 ...].Но я хочу, чтобы выходные данные df имели здесь два уровня индексов: уровень 0 и уровень 3.
В качестве первого шага я хочу удалить имена столбцов «Безымянный ...».Я попытался опубликовать df как вывод вместо изображений, но не уверен, как сделать их правильно: когда я копирую вставить из блокнота jupyter, они вставляют все испорчено.Я совершенно новичок в том, чтобы публиковать здесь вопросы ... так что все еще стараюсь изо всех сил.