Как получить атрибут css элемента lxml? - PullRequest
1 голос
/ 01 марта 2012

Я хочу найти быструю функцию для получения всех свойств стиля элемента lxml, которые учитывают таблицу стилей CSS, элемент атрибута стиля и решают проблему наследования.

Например:

html:

<body>
  <p>A</p>
  <p id='b'>B</p>
  <p style='color:blue'>B</p>
</body>

css:

body {color:red;font-size:12px}
p.b {color:pink;}

python:

elements = document.xpath('//p')
print get_style(element[0]) 
>{color:red,font-size:12px}
print get_style(element[1]) 
>{color:pink,font-size:12px}
print get_style(element[2]) 
>{color:blue,font-size:12px}

Спасибо

1 Ответ

2 голосов
/ 01 марта 2012

Вы можете сделать это с помощью комбинации lxml и cssutils . Этот служебный модуль cssutils должен иметь возможность выполнять то, что вы просите.Установите cssutils вместе с этим модулем, затем запустите следующий код:

from style import *

html = """<body>
    <p>A</p>
    <p id='b'>B</p>
    <p style='color:blue'>B</p>
</body>"""

css = """body {color:red;font-size:12px}
p {color:yellow;}
p.b {color:green;}"""


def get_style(element, view):
    if element != None:
        inline_style = [x[1] for x in element.items() if x[0] == 'style']
        outside_style =  []
        if view.has_key(element):
            outside_style = view[element].getCssText()
        r = [[inline_style, outside_style]]
        r.append(get_style(element.getparent(), view))
        return r
    else:
        return None

document = getDocument(html)
view = getView(document, css)

elements = document.xpath('//p')
print get_style(elements[0], view) 
...