У меня есть список со всеми XLSB, которые я хочу импортировать / читать с python.Следующим шагом является создание цикла для чтения всех файлов в списке.
До сих пор я был в состоянии создать список, но у меня возникает ошибка при попытке объединить все XLSB изсписок.У меня ошибка: «В архиве нет элемента с именем« xl / workbook.bin »»
Это библиотеки, которые у меня есть
import pandas as pd
import xlrd
import numpy as np
import sys
import csv
import openpyxl
import os
from importlib import reload
reload(sys)
import time
timestr = time.strftime("%Y%m%d-%H%M%S")
from pandas import ExcelWriter
from pyxlsb import open_workbook as open_xlsb
timestr = time.strftime("%Y%m%d-%H%M%S")
Путь, в котором хранятсяfiles
path = (r'F:\find\mpc\MAC\CGM\01-CreditCounterpartyRisk\1.2-Overshoot
Monitoring\Monthly CVAR KPI\NewEdge Reports\NewEdge 2019')
files = []
df = []
r = root, d = каталоги, f = files (сохранить имя файла в «Files», если имя файла содержит «2019»)
for r, d, f in os.walk(path):
for file in f:
if '2019' in file:
files.append(os.path.join(r, file))
в этомЧасть I Я пытаюсь открыть / прочитать все XLSB и создать Dataframe для каждого
for ind_file in files:
with open_xlsb(ind_file) as wb:
with wb.get_sheet(2) as sheet:
for row in sheet.rows():
df.append([item.v for item in row])
string = pd.DataFrame(df[1:], columns=df[0])
ОШИБКА: «В архиве нет элемента с именем« xl / workbook.bin »»
Идеально, чего я хочу достичь, это импортировать лист № 2 (лучше, если я смогу указать имя) из всего списка, который я создал.Я хотел бы подчеркнуть, что файл не XLSX, а XLSB