Попробуйте выполнить следующие действия:
Открыть, используя pd.read_excel (), только нужный вам лист и диапазон.
commuting_data_xls = pd.read_excel ("commutingdata.xlsx", '1', заголовок = 4, usecols = range (1,13))
Сброс мультиимена индексов.
commuting_data_xls.index.names = ['Gender', 'Work_Region', 'Region']
Сбросить индекс, а затем ограничить строки, чтобы исключитьитоги, я полагаю, вы хотите, чтобы они ушли?Если нет, просто удалите шаг iloc.
commuting_data_xls = commuting_data_xls.reset_index().iloc[0:28]
Удалите столбец «Work_Region», так как это кажется излишним.
commuting_data_xls = commuting_data_xls.loc[:,commuting_data_xls.columns != 'Work_Region']
Заполните столбец Gender, чтобы заменить NaN
commuting_data_xls['Gender'].fillna(method='ffill', inpldace=True)
Сбросьте индекс, если он соответствует вашим целям.
commuting_data_xls.set_index('Gender', 'Region')