~ / .scripts / url2txt.py
URL = input("Enter a URL ")
# print (URL) //in place originally to verify my input was not the cause for failure
f"wget -O- https://{URL} | lynx -dump -stdin > ~/Documents/name.txt"
Запуск:
python ~/.scripts/url2txt.py
введите URL, нажмите enter
Если при запуске ничего не произойдет,
wget -O- https://www.website.com/2019/02/some-article | lynx -dump -stdin > ~/Documents/name.txt
Что мне нужно отредактировать, чтобы я мог загрузить статью / блог и автоматически назовите выходной текстовый файл с названием статьи?предположительно, обрезать после последнего /
и регулярное выражение заменить -
или _
пробелами.Я понимаю, что мне нужно делать, я не могу обернуться вокруг того, как.
Я осознаю html2txt
и pandoc
.Однако lynx
форматирует вывод более близко к тому, что мне нужно.