Python модуль "twill" - HTML-флуд при назначении переменной - PullRequest
2 голосов
/ 29 апреля 2011

Я делаю простую программу командной строки для сбора и анализа информации с веб-сайтов (довольно общая) с использованием модуля Twill в Python. Я хочу присвоить вывод HTML переменной, используя команду show () Twill для запуска страницы с помощью моих команд синтаксического анализа, но каждый раз, когда я назначаю ее переменной ...

htmlString = twill.commands.show()

Я получаю огромный поток HTML в командной строке (и IDLE, если на то пошло). Почему это? Я не прошу печатать переменную, рядом нет команды печати. Я просто хочу назначить для дальнейшей манипуляции. Почему присвоение переменной вызывает печать? Это не фатальная ошибка или что-то, просто очень, очень неудобно. Я на Python 2.6, Twill 0.9 и Ubuntu, если это относится к чему-либо.

Ответы [ 2 ]

3 голосов
/ 29 апреля 2011

Я бы предложил использовать lxml или BeautifulSoup для разбора HTML, никогда не сталкивался с twill. Но я вижу, что вы вызываете метод .show(), возможно, у этого метода есть оператор print внутри.

1 голос
/ 26 сентября 2011

Twill нечетный и выводит много вывода на терминал.Причиной распечатки материала является не присвоение переменной, а метод show()Он напечатает (а не вернет) вывод.

...