Pandas dataframe read_excel не считает пустые верхние левые ячейки столбцами? - PullRequest
0 голосов
/ 12 октября 2018

Я пытаюсь прочитать файл Excel или CSV в pandas dataframe.Файл будет читать только первые два столбца, а верхняя строка первых двух столбцов будет именами столбцов.Проблема в том, что у меня первый столбец верхней строки пуст в файле Excel.

            IDs
2/26/2010    2
3/31/2010    4
4/31/2010    2
5/31/2010    2

Затем последняя строка следующего кода завершается ошибкой:

uploaded_file = request.FILES['file-name']
if uploaded_file.name.endswith('.csv'):
    df = pd.read_csv(uploaded_file, usecols=[0,1])
else:
    df = pd.read_excel(uploaded_file, usecols=[0,1])

ref_date = 'ref_date'
regime_tag = 'regime_tag'
df.columns = [ref_date, regime_tag]

Видимо,он читает только один столбец (то есть идентификаторы).Однако при read_csv он читает оба столбца, причем первый столбец unnamed.Я хочу, чтобы он вел себя таким образом и читал оба столбца, независимо от того, являются ли верхние ячейки пустыми или заполненными.Как мне это сделать?

1 Ответ

0 голосов
/ 12 октября 2018

Происходит то, что первый «столбец» в файле Excel читается как индекс, а в CSV-файле он обрабатывается как столбец / серия.

Я рекомендую вам работатьдругой способ и изменить pd.read_csv, чтобы прочитать первый столбец как индекс.Затем используйте reset_index, чтобы поднять индекс в ряд:

if uploaded_file.name.endswith('.csv'):
    df = pd.read_csv(uploaded_file, usecols=[0,1], index_col=0)
else:
    df = pd.read_excel(uploaded_file, header=[0,1], usecols=[0,1])

df = df.reset_index()  # this will elevate index to a column called 'index'

Это даст последовательный вывод, т.е. первая серия будет иметь метку 'index', а индекс кадра данных будет обычным pd.RangeIndex.

Вы можете использовать диспетчер, чтобы избавиться от громоздкой if / else конструкции:

file_flag = {True: pd.read_csv, False: pd.read_excel}
read_func = file_flag[uploaded_file.name.endswith('.csv')]

df = read_func(uploaded_file, usecols=[0,1], index_col=0).reset_index()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...