Как «прочитать» HTML-документ на PHP? - PullRequest
0 голосов
/ 07 марта 2012

Я довольно долго сталкиваюсь с проблемой. К сожалению, я не смог найти решение самостоятельно, поэтому я должен разместить свой вопрос здесь.

Я пишу небольшой скрипт php, который создает файл PDF из динамически создаваемого файла HTML.

Теперь я хочу "разобрать" html-файл и выполнить действие в зависимости от того, какой тег является следующим в HTML.

1007 * Е.Г. *

<div><p>Test</p></div>

Мой скрипт должен распознавать:

Первый тег - это div: функция do для div Второй тег - это функция p: do для p

Я не знаю, что мне следует искать. Регулярные выражения? HTML-парсер?

Спасибо за подсказку!

Ответы [ 3 ]

0 голосов
/ 07 марта 2012

Что вам нужно сделать, это прочитать файл HTML в PHP variable/object http://www.php -mysql-tutorial.com / вики / PHP-учебник / чтения в HTML-файлы, используя-php.aspx

А затем используйте RegEx для разбора HTML Tags и Attributes http://www.codeproject.com/Articles/297056/Most-Important-Regular-Expression-for-parsing-HTML

0 голосов
/ 07 марта 2012

Я использовал несколько раз phpQuery . Это хорошее решение, хотя оно довольно большое и, кажется, больше не поддерживается (последний коммит> 10 месяцев).

0 голосов
/ 07 марта 2012

Попробуйте парсер XML.В PHP SimpleXML, вероятно, то, что вы ищете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...