Я анализирую HTML с помощью lxml, но мне нужно только небольшое подмножество тегов.Какой самый эффективный способ сделать это? - PullRequest
0 голосов
/ 17 февраля 2011

Я бы предпочел не строить все дерево в памяти, а просто выбирать элементы, которые я ищу.

1 Ответ

0 голосов
/ 17 февраля 2011

Вы всегда можете использовать PyQuery ;библиотека, подобная JQuery, для быстрой работы с XML и XHTML.

...