Как разобрать переменную в вызове wget? - PullRequest
0 голосов
/ 22 февраля 2019

~ / .scripts / url2txt.py

URL = input("Enter a URL ")

# print (URL) //in place originally to verify my input was not the cause for failure

f"wget -O- https://{URL} | lynx -dump -stdin > ~/Documents/name.txt"

Запуск:

python ~/.scripts/url2txt.py введите URL, нажмите enter

Если при запуске ничего не произойдет,

wget -O- https://www.website.com/2019/02/some-article | lynx -dump -stdin > ~/Documents/name.txt


Что мне нужно отредактировать, чтобы я мог загрузить статью / блог и автоматически назовите выходной текстовый файл с названием статьи?предположительно, обрезать после последнего / и регулярное выражение заменить - или _ пробелами.Я понимаю, что мне нужно делать, я не могу обернуться вокруг того, как.


Я осознаю html2txt и pandoc.Однако lynx форматирует вывод более близко к тому, что мне нужно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...