Получить содержимое элемента из переменной, содержащей html - PullRequest
1 голос
/ 25 июня 2010

Как использовать синтаксический анализатор DOM для извлечения содержимого html-элемента в переменную.

Точнее: У меня есть форма, где пользователь вводит HTML в текстовой области. Я хочу извлечь содержание первого абзаца.

Я знаю, что есть много уроков по этому вопросу, но не смог найти ни одного по извлечению из переменной, а не из файла (страницы)

Спасибо

1 Ответ

1 голос
/ 25 июня 2010

Если вы принимаете HTML за пользовательский ввод, я рекомендую использовать simplehtmldom .У него есть свободный анализатор с допуском к ошибочному html и позволяет использовать CSS-селекторы для извлечения элементов и их содержимого из DOM.

Я не проверял это, но он должен работать:

$html = str_get_html($_POST['input']);
print $html->find('p:first')->plaintext; // first paragraph
...