установить каталог для программы поиска в python - PullRequest
1 голос
/ 21 февраля 2020

Я пытаюсь разработать CNN для обработки изображений. У меня около 130 гигабайт, хранящихся на отдельном диске моего компа, и у меня возникают проблемы при навигации по простой поисковой программе python для поиска в указанном каталоге. Я пытаюсь найти кучу случайных XML файлов, разбросанных по множеству подкаталогов / подкаталогов / subs на этом диске. Как мне указать только для этой python программы каталог, в котором она должна искать, сохраняя его только в контексте программы?

Я попытался установить переменную Path = "B:\\MainFolder\SubFolder" и использовать os.walk, но он проходит через первый каталог, затем останавливается.

Ответы [ 2 ]

0 голосов
/ 21 февраля 2020

Джериль и Эдуардо, спасибо за помощь. Я выстрелил в Pathlib, и это сработало. idk, что случилось с моим глоб-кодом, выглядело в основном так же, как ваш Джериль:

import glob, os

filelist = []

from pathlib import Path

for path in Path('B:\\CTImageDataset\LIDC-IDRI').rglob('*.xml'):
    filelist.append(path.name)
    print(filelist)

Отлично сработало, еще раз спасибо

0 голосов
/ 21 февраля 2020

Вы можете попробовать следующее:

import os
import glob
base_dir = 'your/start/sirectory'
req_files = glob.glob(os.path.join(base_dir, '**/*.xml'), recursive=True)
...