NotImplementedError: Относительные шаблоны не поддерживаются при попытке зацикливания всех. html файлов в каталоге - PullRequest
0 голосов
/ 20 февраля 2020

Я пытаюсь l oop по всем html файлам в каталоге, но получаю эту ошибку:

NotImplementedError: Non-relative patterns are unsupported

Я использую код:

from bs4 import BeautifulSoup
import argparse
from pathlib import Path

parser = argparse.ArgumentParser(description = ("Script to scrape data from antismash html output"))

parser.add_argument("-p", "--path", help = "give path/to/directory containing antismash outputs", required = True)

args = parser.parse_args()

for file in Path(args.path).glob("/*.html"):
    def scraper(filename):
        soup = BeautifulSoup(open(filename), 'html.parser')
        soup.findAll('a') > os.path.basename(filename).txt

Я ранее использовал тот же метод и не получил ошибку, поэтому я не уверен, что происходит.

1 Ответ

0 голосов
/ 20 февраля 2020

Вам не нужно использовать / внутри вызова glob при работе с PathLib для правильного кода:

for file in Path(args.path).glob("*.html"):
    def scraper(filename):
        soup = BeautifulSoup(open(filename), 'html.parser')
        soup.findAll('a') > os.path.basename(filename).txt
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...