Вопросы с тегом HTML-синтаксический

4 голосов

4 ответов

Регулярные выражения против XPath при разборе текста HTML

Я хочу разобрать текст HTML и найти специальные части. Например, текст 3-го div из 1-го row и 2-го...

Afshar Mohebbi / 26 августа 2011

7 голосов

3 ответов

Получение очищенного HTML в тексте от HtmlCleaner

Я хочу увидеть очищенный HTML, который мы получаем от HTMLCleaner.Я вижу, что есть метод с именем...

Nayn / 25 августа 2011

5 голосов

1 ответ

Получить текст вне одного тега и внутри другого

Я анализирую веб-страницу с BeautifulSoup, и она имеет некоторые элементы, такие как:...

murgatroid99 / 25 августа 2011

0 голосов

1 ответ

Как создать схему структуры HTML-тегов на странице с помощью Nokogiri?

Я пытаюсь создать схему структуры тегов HTML-страницы с помощью Nokogiri, которую я могу...

Williamf / 24 августа 2011

109 голосов

14 ответов

Regex выделить весь текст между тегами

Каков наилучший способ выделить весь текст между двумя тегами - например, текст между всеми тегами...

basheps / 24 августа 2011

16 голосов

1 ответ

Как извлечь отдельные текстовые узлы с помощью Jsoup?

У меня есть такой элемент: <td> TextA <br/> TextB </td> Как я могу извлечь TextA...

M.M / 23 августа 2011

3 голосов

1 ответ

Какие элементы HTML должны иметь не <body>родительские элементы?

Я ищу список HTML-элементов, у которых должны быть родительские элементы (кроме <body>),...

Brian R. Bondy / 23 августа 2011

0 голосов

3 ответов

Разобрать текст из таблицы базы данных как HTML на окончательной странице рендеринга PHP

Одним из полей на нашей странице PHP является описание - иногда есть ссылки на веб-сайты.Однако при...

JoeW / 23 августа 2011

4 голосов

1 ответ

Jsoup.parse () против Jsoup.parse () - или Как работает определение URL в Jsoup?

Jsoup имеет 2 html методы parse (): parse (String html) - "Поскольку базовый URI не указан,...

Regex Rookie / 22 августа 2011

0 голосов

2 ответов

Python, извлекающий атрибуты тегов HTML без регулярных выражений

Есть ли способ использовать urlib, urllib2 или BeautifulSoup для извлечения атрибутов HTML-тегов?...

daydreamer / 22 августа 2011

0 голосов

1 ответ

XPath как искать строку iphone

Я использую hpple для разбора содержимого со страницы HTML. Я хочу найти строку «Содержание курса»...

Spike Lee / 22 августа 2011

1 голос

2 ответов

Cocoa Touch NSRegularExpression pattern

У меня есть приложение, которое я пишу, которое получает HTML-код с веб-сайта.У меня есть строка с...

futurevilla216 / 20 августа 2011

3 голосов

2 ответов

Jsoup Выбрать только самые внутренние div

Есть ли способ выбрать в Jsoup только самые внутренние элементы div (т. Е. Элементы div, которые не...

Regex Rookie / 20 августа 2011

4 голосов

1 ответ

Как мне разобрать HTML-документ с помощью JSoup, чтобы получить список ссылок?

Я пытаюсь разобрать http://www.craigslist.org/about/sites, чтобы создать набор текста / ссылок для...

Andrew / 19 августа 2011

3 голосов

2 ответов

Perl HTML :: ошибка парсера;Неопределенная подпрограмма и главная :: 1

Я получаю ошибку Undefined subroutine &main::1 called at /usr/local/lib/perl/5.10.0/HTML/Parser

Nick Johnson / 19 августа 2011

0 голосов

1 ответ

Проблема с регулярными выражениями PHP

Я просто не могу понять, как извлечь всю таблицу со страницы с помощью регулярных выражений. Это...

Miguel A. Friginal / 18 августа 2011

1 голос

6 ответов

Замените набор html br элементов на другой в jQuery - анализ HTML с помощью jQuery

Так вот моя проблема. У меня есть небольшой сторонний сервис на моем сайте, который генерирует кучу...

ihake / 18 августа 2011

0 голосов

1 ответ

извлечь текст из HTML с помощью регулярных выражений или другим методом

Я пытаюсь извлечь текст "abcdef" из следующего HTML-кода с помощью регулярных выражений: <a...

qmaruf / 17 августа 2011

0 голосов

1 ответ

Как полностью очистить элемент?

Я использую simplehtmldom.sourceforge.net Мне нужен прозрачный элемент $e <font...

Mediator / 17 августа 2011

0 голосов

3 ответов

как получить изображение из DIV с помощью C #

возможно ли получить изображение, встроенное в div, через C # и прикрепить его к электронному...

gsharpp / 16 августа 2011

3 голосов

2 ответов

Время загрузки: быстрее ли анализировать HTML с помощью DOMDocument PHP или с помощью регулярных выражений?

Я перетаскиваю изображения из своей учетной записи Flickr на мой веб-сайт, и я использовал около...

bozdoz / 15 августа 2011

0 голосов

2 ответов

HTML-разбор регулярных выражений

Я хочу проанализировать документ HTML и получить псевдонимы всех пользователей. Они в этом формате:...

André Cardoso / 14 августа 2011

0 голосов

1 ответ

Скрипт bash / awk извлекает метаданные html, необходимо удалить пробелы и записать в файл

У меня есть каталог html-файлов, любезно предоставленный wget, и мне нужно извлечь тег заголовка и...

chuckfinley / 14 августа 2011

0 голосов

3 ответов

регулярное выражение в php удалить цитату из текста вики

Из данного образца текста я хочу, чтобы текст был отделен от тех, которые содержатся в [[]] и {{}}...

Ram Kumar / 14 августа 2011

3 голосов

1 ответ

Проблема в получении реального HTML с использованием C # ....

У меня есть одно приложение winform. Я могу получить HTML страницы, используя вызов webclient или...

SOF User / 14 августа 2011