Итак, я читаю файлы xlsx, и мне нужно выбрать 3 определенных столбца, затем переименовать их и перенести первые 100 строк каждого столбца в новый файл xlsx, удалив их из исходного.
Мой код на данный момент считывает данные из отредактированного вручную файла xlsx, где я переименовываю столбцы, выбираю первые 100 из них (кроме заголовка) и т. Д .:
df = pandas.read_excel('test.xlsx', names=['date', 'value', 'source'])
df['date'] = pandas.to_datetime(df['date'], format='%b %d %Y.%f').astype(str)
print(df.head(5))
Что возвращает, как и ожидалось:
date value source
0 2018-05-01 1 xxxxxxx
1 2018-05-01 1 xxxxxxxxxxxxxxxxx
2 2018-05-02 1 xxxxxxxxxxxxxxxxx
3 2018-05-02 1 xxxxxxxxxxxxxxxxx
4 2018-05-03 1 xxxxxxxxxxxxxxxxxx
Есть ли способ автоматически читать и редактировать файл xlsx с помощью панд? Другие библиотеки? Я новичок в Python, и я действительно потерян здесь: (