Python, разбирать HTML-форму - PullRequest
       5

Python, разбирать HTML-форму

2 голосов
/ 22 августа 2010

как я могу получить информацию из HTML-форм на других сайтах? Я хочу, чтобы он возвращал словарь, такой как:

form = [('name' = 'somename', 'type' = 'text', 'value':''},{' name' = 'somename', 'type' = 'submit', 'value': ' submit ').

Извините за мой английский.

Ответы [ 4 ]

3 голосов
/ 22 августа 2010

вы, вероятно, не сможете получить данные формы от других пользователей на других сайтах. Если вы хотите использовать скрипт для отправки данных в форму, mechanize - это один из инструментов, который делает это довольно простым.

1 голос
/ 21 сентября 2010

Да, механизировать сладко!

import mechanize

# Browser
br = mechanize.Browser()
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]

# we inspect the all form element in the http://stackoverflow.com
br.open('http://stackoverflow.com')
for form in br.forms():
    print form
1 голос
/ 22 августа 2010

Посмотрите на mechanize, lxml.html и BeatifulSoup.

0 голосов
/ 29 мая 2019

проверить модуль запросов или Beautifulsoup

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...