Я использую предоставленную поставщиком среду jupyter, размещенную на удаленном сервере, файлы проекта хранятся локально.
У меня есть куча файлов Excel, из которых я читаю данные, и использую API поставщика для получения других полей.
Я столкнулся с проблемой, когда, если я использую os.listdir () для цикла, я продолжаю получать доступ к тем же файлам. Я чувствую, что приложение вендора периодически делает снимок моего каталога проекта для синхронизации, и если в то же время я нахожусь в процессе доступа к данным из большого файла Excel, итератор файла получает сброс к новому снимку, и я в итоге читаю то же самое файлы снова и снова.
for file in os.listdir(path):
print(file)
full_file_name=os.path.join(path,file)
try:
with pd.ExcelFile(full_file_name) as file_read:
print(file_read)
## Code to read data from different tabs
Output:
Portfolio positions 3.xlsx
Portfolio positions 3.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CB10BCF8>
Portfolio positions 3.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CB10BCF8>
Portfolio positions 4.xlsx
Portfolio positions 3.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CB10BCF8>
Portfolio positions 4.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CAF12908>
Portfolio positions 3.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CB10BCF8>
Portfolio positions 4.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CAF12908>
Portfolio positions 5.xlsx
Portfolio positions 3.xlsx
<pandas.io.excel.ExcelFile object at 0x000001C8CB10BCF8>
...
etc