Я делаю веб-сканер. Для поиска ссылок на странице я использовал xpath в селене driver = webdriver
Я анализирую HTML-документ, используя библиотеку http://lxml.de/. До сих пор я выяснил, как удалить...
У меня есть XML-файл, который выглядит так: xml = '''<?xml version="1
Я настроил пользовательский словарь поиска пространства имен , чтобы сопоставить элементы в файлах...
Недавно я увидел, что другой пользователь задал вопрос об извлечении информации из веб-таблицы...
Представьте, что у меня есть файл test.html с содержимым, <?xml version="1.0"...
У меня есть элемент на странице, который выглядит следующим образом: <a...
<div id="descriptionmodule" class="module toggle-wrap"> <div...
В настоящее время я пытаюсь итеративно анализировать очень большой HTML-документ (я знаю ... хм),...
Я использую lxml, чтобы сгенерировать xml и проверить его. Я обнаружил, что когда я пытаюсь...
У меня проблемы с намоткой головы на lxml. У меня есть html, который я хочу разобрать, и мне...
Я пытаюсь создать дерево xml из объекта JSON, используя lxml.etree. Некоторые из тэгов содержат...
У меня проблемы с получением lxml для успешной проверки некоторых xml. Схема XSD и файл XML взяты...
У меня есть устаревший формат файла, который я конвертирую в XML для обработки.Структура может быть...
Я довольно новичок в XPath и не могу понять это, глядя на другие решения. Я пытаюсь выделить все...
Я знаю, как разобрать страницу, используя Python. У меня вопрос, какой из всех методов разбора...
Я работаю над приложением django для bitnami djangostack.Я хочу использовать библиотеку lxml, но я...
У меня не очень хорошо сформированный XML с дефисами внутри имен тегов, который я хочу заменить на...
Я пытаюсь настроить pyquery, но мне трудно. .py файл setup.py, который импортирует из setuptools Я...
Мне нужно найти позицию или полный текст тега, используя lxml.html. Например: [some html code]...
Я провел последние пару дней, чтобы разобраться с основами lxml; в частности, используя lxml.html...
Есть ли способ получить исходное местоположение элемента в документе, т.е.индекс начала и конца...
Я искал везде и больше всего нашел doc.xpath ('// element [@ class = "classname"]'), но это не...
Я не могу использовать аргумент pretty_print для печати xml.Есть идеи, что может быть не так? Я...
Я ищу рецепт для lxml.etree Python, который обратит вложенность элементов, превращая: <text>...