Чтение и редактирование файлов Excel с пандами - PullRequest
0 голосов
/ 14 мая 2018

Итак, я читаю файлы xlsx, и мне нужно выбрать 3 определенных столбца, затем переименовать их и перенести первые 100 строк каждого столбца в новый файл xlsx, удалив их из исходного.

Мой код на данный момент считывает данные из отредактированного вручную файла xlsx, где я переименовываю столбцы, выбираю первые 100 из них (кроме заголовка) и т. Д .:

df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)

print(df.head(5))

Что возвращает, как и ожидалось:

         date    value               source

0  2018-05-01      1                xxxxxxx
1  2018-05-01      1      xxxxxxxxxxxxxxxxx
2  2018-05-02      1      xxxxxxxxxxxxxxxxx
3  2018-05-02      1      xxxxxxxxxxxxxxxxx
4  2018-05-03      1     xxxxxxxxxxxxxxxxxx

Есть ли способ автоматически читать и редактировать файл xlsx с помощью панд? Другие библиотеки? Я новичок в Python, и я действительно потерян здесь: (

1 Ответ

0 голосов
/ 14 мая 2018

Похоже, вам нужно 2 файла вывода. Один с первой сотней строк, другой с остатком. Это просто с pandas.DataFrame.iloc:

import pandas as pd

df = pd.read_excel('test.xlsx', names=['date', 'value', 'source'])

df.iloc[:100].to_excel('out1.xlsx', index=False)
df.iloc[100:].to_excel('out2.xlsx', index=False)
...