Question

Мне нужно извлечь подробный контент сайта, сохранив все форматирование раздела. Раздел, который я хочу извлечь:

...
<div class="detailContent"><p>
<P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
</div> 
...

Мое текущее решение - использовать HTMLParser из libxml2 и xpath, чтобы найти узлы и пройтись по всем узлам, чтобы восстановить этот фрагмент HTML. Это длинный и сложный код.

Мне просто интересно, есть ли более простое решение для извлечения части HTML?

Спасибо.

Chuck · Answer 1 · 16 июня 2010

Простое решение Javascript: document.getElementsByClassName("detailContent")

Объедините это с поддержкой UIWebView для запуска Javascript, и у вас может быть более краткое решение.

Извлечь часть HTML в C / Objective-C

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Извлечь часть HTML в C / Objective-C

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы