Как отобразить веб-страницу с Python? - PullRequest
0 голосов
/ 04 декабря 2011

Я хочу прочитать пользовательский ввод в Python, чтобы получить URL (например, http://www.google.com), а затем распечатать веб-страницу в формате HTML (только текст) на терминал. Я пытался использовать pexpect.spawn('elinks'), но elinks не делает 'Кажется, я пишу на стандартный вывод. Я также посмотрел на модуль HTMLParser, но не знаю, как отформатировать полученный текст во что-то, напоминающее веб-страницу. Любой совет?

Ответы [ 3 ]

1 голос
/ 04 декабря 2011

Это не маленькая проблема.Тот факт, что вы хотите порождать elinks, заставляет меня задуматься, почему вы просто не используете его вместо этого.Посмотрите, какие у него есть опции расширяемости / плагинов / надстроек, или попробуйте переписать его в соответствии с вашими конкретными потребностями.

В конечном итоге вам нужно написать собственный движок макета браузера с бэкэндом curses.Если вы используете python, urwid является популярным выбором для макетов curses.

0 голосов
/ 27 сентября 2014
import requests
r = requests.get('http://www.google.com/')
print(r.content)
0 голосов
/ 05 декабря 2011

с python urllib

введите url -> urllib -> страницу -> печать в консоли

# example in the python urllib page

import urllib

opener = urllib.FancyURLopener({})
f = opener.open("http://www.python.org/")
f.read()

# modify:

html = f.read()

# add:

print html

# to print in terminal

аналогично "curl" в unix

...