От HTML к стилю CSS с Python - PullRequest
0 голосов
/ 12 июля 2011

Я извлек определенные элементы из HTML-страницы с BeautifulSoup и хочу извлечь соответствующие стили CSS (которые в большинстве случаев находятся во внешних файлах CSS) с помощью Python.

Как я могу получить селектор jQueryесли у меня есть элемент HTML?Если бы у меня был этот селектор, я мог бы использовать cssutils для разбора CSS и получить его.

TIA за помощь.

1 Ответ

0 голосов
/ 12 июля 2011

Вы можете взглянуть на API PyQuery . Он обеспечивает такой же синтаксис селектора css, как и jQuery, и он намного быстрее, чем beautifulsoup, потому что для анализа он использует lxml.

import pyquery.PyQuery as pq # you can treat it as a css selector

html = '<div class="foo"><a href="somewhere"></a></div>'
parsed = pq(html) # PyQuery object, is a callable

pq_list = parsed('.foo a') # doing css selection
for node in pq_list: # node here is a lxml element object
    print node.attrib['href'] # => somewhere
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...