Как собрать данные с веб-сайта и сохранить их в папках в иерархической структуре с помощью скрипта Python? - PullRequest
0 голосов
/ 18 февраля 2019

Я пытаюсь получить данные с веб-сайта, используя python, затем я локально загрузил текстовый файл, я хочу получить данные из тега привязки внутри текстового файла и создать новую папку, переименованную в значение тега привязки.

Здесь я создаю новые папки, используя python, но не могу извлечь данные из txt-файла и обработать

Я могу создавать новые папки, но я хочу переименовать в качестве значения тега привязки

import os

root_path = '/home'    
folders = ['folder 01', 'folder 02', 'folder 03']    
for folder in folders:
    os.mkdir(os.path.join(root_path, folder))

1 Ответ

0 голосов
/ 18 февраля 2019

Пожалуйста, попробуйте следующий код. Он должен создать все имена папок, присутствующих в теге привязки.

from bs4 import BeautifulSoup
import requests
import os
url = 'Url Here'
html = requests.get(url).text
soup = BeautifulSoup(html, 'html.parser')
for folder in soup.find_all('a'):
    root_path = '/home'
    os.mkdir(os.path.join(root_path, folder.text))

Пожалуйста, дайте мне знать, если это работает.

...