Как я могу запросить XHTML с помощью Python? - PullRequest
1 голос
/ 01 декабря 2009

Я создал простой тестовый набор в python для моего веб-сайта ASP .net.

Я хотел бы найти некоторые HTML-теги на полученной странице, чтобы найти определенные значения. \

Каков наилучший способ сделать это в Python?

например (возвращенная страница):

<div id="ErrorPanel">An error occurred......</div>

будет отображаться (в стандартный вывод из Python):

Error: .....

или

<td id="dob">23/3/1985</td>

будет отображаться:

Date of birth: 23/3/1985

Ответы [ 2 ]

4 голосов
/ 01 декабря 2009

Вы также можете сделать это с lxml . Он очень хорошо обрабатывает HTML , и вы можете использовать селекторы CSS для запроса DOM, что делает его особенно привлекательным, если вы регулярно используете библиотеки, такие как jQuery.

4 голосов
/ 01 декабря 2009

Хотите ли вы разобрать XML, как вы указали в заголовке вопроса, или HTML, как вы видите в тексте вопроса? Для последнего я рекомендую BeautifulSoup - загрузите его и установите, затем, сделав объект soup из HTML, вы можете легко найти тег с определенным идентификатором (или другим атрибутом ), например:

errp = soup.find(attrs={'id': 'ErrorPanel'})
if errp is not None:
  print 'Error:', errp.string

и аналогично для другого случая (легко настраиваемый, например, в цикл, если вы ищете неуникальные атрибуты и т. Д.).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...