PHP: извлекать текст из строки между двумя конкретными тегами - PullRequest
0 голосов
/ 20 февраля 2012

Я собираю функцию быстрого извлечения в PHP. По сути, он будет читать содержимое данного URL и извлекать необходимый HTML-код. Затем он поместит код на новую страницу. Теперь у меня все работает, кроме одной вещи.

У меня есть строка с содержимым URL, и теперь я хочу извлечь текст между двумя тегами. Допустим, я хочу начать копировать контент с определенного тега. Это легко, поскольку у этих тегов есть классы.

Так что я бы запустил функцию с "". Она просто ищет в документе весь текст, который соответствует этому. Я столкнулся с проблемой, хотя. В разделе, который я хочу скопировать, есть другие теги. Таким образом, если я скажу функции прекратить извлечение в «», скребок прекратит чтение в конце случайного тега. Может кто-нибудь помочь мне написать немного кода PHP, который будет гарантировать, что тег, на котором останавливается функция, является закрывающим тегом для "", а не для какого-то случайного тега, который находится в строке?

Заранее спасибо.

1 Ответ

3 голосов
/ 20 февраля 2012

Нет способа сделать это и учесть все возможное содержимое между тегами. Используйте XmlDocument и разберите HTML.

...