Я хочу разобрать текст HTML и найти специальные части. Например, текст 3-го div из 1-го row и 2-го...
Я хочу увидеть очищенный HTML, который мы получаем от HTMLCleaner.Я вижу, что есть метод с именем...
Я анализирую веб-страницу с BeautifulSoup, и она имеет некоторые элементы, такие как:...
Я пытаюсь создать схему структуры тегов HTML-страницы с помощью Nokogiri, которую я могу...
Каков наилучший способ выделить весь текст между двумя тегами - например, текст между всеми тегами...
У меня есть такой элемент: <td> TextA <br/> TextB </td> Как я могу извлечь TextA...
Я ищу список HTML-элементов, у которых должны быть родительские элементы (кроме <body>),...
Одним из полей на нашей странице PHP является описание - иногда есть ссылки на веб-сайты.Однако при...
Jsoup имеет 2 html методы parse (): parse (String html) - "Поскольку базовый URI не указан,...
Есть ли способ использовать urlib, urllib2 или BeautifulSoup для извлечения атрибутов HTML-тегов?...
Я использую hpple для разбора содержимого со страницы HTML. Я хочу найти строку «Содержание курса»...
У меня есть приложение, которое я пишу, которое получает HTML-код с веб-сайта.У меня есть строка с...
Есть ли способ выбрать в Jsoup только самые внутренние элементы div (т. Е. Элементы div, которые не...
Я пытаюсь разобрать http://www.craigslist.org/about/sites, чтобы создать набор текста / ссылок для...
Я получаю ошибку Undefined subroutine &main::1 called at /usr/local/lib/perl/5.10.0/HTML/Parser
Я просто не могу понять, как извлечь всю таблицу со страницы с помощью регулярных выражений. Это...
Так вот моя проблема. У меня есть небольшой сторонний сервис на моем сайте, который генерирует кучу...
Я пытаюсь извлечь текст "abcdef" из следующего HTML-кода с помощью регулярных выражений: <a...
Я использую simplehtmldom.sourceforge.net Мне нужен прозрачный элемент $e <font...
возможно ли получить изображение, встроенное в div, через C # и прикрепить его к электронному...
Я перетаскиваю изображения из своей учетной записи Flickr на мой веб-сайт, и я использовал около...
Я хочу проанализировать документ HTML и получить псевдонимы всех пользователей. Они в этом формате:...
У меня есть каталог html-файлов, любезно предоставленный wget, и мне нужно извлечь тег заголовка и...
Из данного образца текста я хочу, чтобы текст был отделен от тех, которые содержатся в [[]] и {{}}...
У меня есть одно приложение winform. Я могу получить HTML страницы, используя вызов webclient или...