Я пытаюсь использовать python (с pyquery и lxml) для изменения и очистки некоторых html. Eg. html =...
Я редактирую файл XML, предоставленный третьей стороной. XML используется для воссоздания всей...
Я пытаюсь получить ссылки со страницы с xpath.Проблема в том, что мне нужны только ссылки внутри...
Я долго бился об этом, я, должно быть, делал что-то глупое. Я пытаюсь получить все возможные языки,...
Я удалил html через xpath, который затем преобразовал в etree. Нечто похожее на это: <td>...
Я пытаюсь проанализировать HTML-страницу в Python, используя lxml.html. Я использовал следующий...
Я много искал о BeautifulSoup, и некоторые предложили lxml как будущее BeautifulSoup, хотя это...
Мне нужна помощь в исправлении этого выражения lxml для извлечения: http://www.etc.. / 1tru.jpg...
Есть ли способ проверить узлы, совпадающие с библиотекой lxml?Например, в php DOMDocument есть...
Последние несколько часов я пытался написать программу, которая, как мне показалось, была бы...
Я пытаюсь получить список всех заголовков с сайта Reddit.com, используя lxml.Я использовал этот...
Я анализирую сайт с каким-то грязным html-кодом, это 130 дочерних сайтов, и единственный, который...
У меня есть xml как это: <a> <b>hello</b> <b>world</b> </a>...
Я использую lxml 2.2.8 и пытаюсь преобразовать некоторые существующие html-файлы в шаблоны django
Проблема заключается в следующем: у меня есть фрагмент XML, например: <fragment>text1...
У меня есть около 4000 HTML-документов, которые я пытаюсь преобразовать в шаблоны Django, используя...
Я повторяю значения узлов xml, которые я получаю из запроса xpath. И мне нужно назначить ссылку на...
Я установил Python 2.6.6 на CentOS 5.4, [siyuan.tong@SC-055 lxml-2.3beta1]$ python Python 2.6.6...
Я использую mechanize / cookiejar / lxml для чтения страницы, и она работает для некоторых, но не...
Я хотел бы написать фрагмент кода, который будет захватывать весь текст внутри тега <content>...
Функция lxml tostring() выглядит совершенно неработоспособной при печати только частей документов....
при запуске скрипта на python я получил эту ошибку from lxml import etree ImportError: No module...
<html> <head> <script type="text/javascript"> document.write('<a...
Я пытаюсь использовать lxml для возврата текста внутри тегов...
Я новичок в XPath, и мне нужно получить узел таблицы после следующего: <p><b>Some...