Оценка путей к файлам в Excel - PullRequest
0 голосов
/ 25 октября 2018

У меня есть постоянно растущий список путей к файлам (сейчас у меня около 5000 записей) в Excel.В частности, у меня есть определенный уникальный идентификатор в столбце A, а в столбце B - путь к файлу, который приводит к изображению для этого уникального идентификатора.

Процесс добавления путей к файлам очень ручной, а иногдаошибки случаются.Итак, я хотел создать код, который проходит через каждый из этих путей к файлам, и если путь к файлу не открывается / возвращает ошибку, чтобы сохранить эти значения в списке, чтобы я мог перейти непосредственно к ним и исправить путь к файлу.,

Я думал о написании кода Python, который проверяет путь к файлу в URL-адресе Google Chrome (я нашел, что он работает лучше, чем прямой щелчок по гиперссылке в Excel), но уже давно я использую Pythonи не знаете с чего начать.

Любые рекомендации / идеи, как этого достичь?

Спасибо, Рикардо Г.

1 Ответ

0 голосов
/ 25 октября 2018

Для чтения файлов Excel я предпочитаю использовать библиотеку панд, в частности функцию read_excel .Вы также можете проверить, является ли filepath действительным существующим файлом в вашей файловой системе, используя модуль os.path.os.path.isfile возвращает значение True, если указанный путь указывает на фактический файл, поэтому вы хотите использовать понимание списка с фильтром, чтобы иметь пути к файлам только там, где это не так.

import pandas as pd
import os

df = pd.read_excel('path/to/excel')

bad_files = [fp for fp in df['filepath_column'] if !os.path.isfile(path)]

Я ненаверняка, что вы подразумеваете под проверкой с помощью Google Chrome, но если вы говорите о локальных файлах, это должно сработать для вас.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...