Я пытаюсь прочитать Excel, в котором есть пустые строки и столбцы. Процесс становится более сложным, так как он имеет некоторые ненужные значения перед заголовком.
В настоящее время я жестко задаю имя столбца для извлечения таблицы. Это имеет два недостатка: что, если столбец отсутствует в таблице, и что, если имя столбца повторяется в значении столбца. Есть ли способ динамически написать программу, которая автоматически определяет заголовок таблицы и читает таблицу?
фрагмент кода:
raw_data = pd.read_excel('test_data1.xlsx','Sheet8',header=None)
data_duplicate = pd.DataFrame()
for row in range(raw_data.shape[0]):
for col in range(raw_data.shape[1]):
if raw_data.iloc[row,col] == 'Currency':
data_duplicate = raw_data.iloc[(row+1):].reset_index(drop=True)
data_duplicate.columns = list(raw_data.iloc[row])
break
data_duplicate.dropna(axis=1, how='all',inplace=True)
data_duplicate
Также количество строк банка + строк мусора до заголовка не исправлена.