Извлеките все ссылки, которые заканчиваются расширением .js на html-странице - PullRequest
1 голос
/ 30 марта 2012

Я хочу извлечь все ссылки, заканчивающиеся на .js на html-странице. Я могу выбрать ссылки, которые находятся внутри тега script, но как я могу получить ссылки из свойств, таких как {"yui": "http://l.yimg.com/nn/lib/metro/g/uicontrib/yui/yui_3.4.1.js"}. Я хочу этодолжно быть сделано в php

Ответы [ 2 ]

0 голосов
/ 30 марта 2012

Для базовых элементов HTML вы можете использовать http://code.google.com/p/phpquery/ для анализа содержимого DOM (он обрабатывает jquery как CSS-селекторы, функции как attr, find). Вот пример того, как использовать селекторы с PhpQuery http://code.google.com/p/phpquery/wiki/Selectors.

Для свойств это зависит:

  • Какое-то регулярное выражение, если они в Javascripts или что-то еще,
  • Если они находятся в атрибутах данных и вы знаете имя атрибута, тогда вы можете получить эту строку json и просто запустить на ней json_decode php функцию.
0 голосов
/ 30 марта 2012

Простой анализатор PHP HTML DOM, написанный на PHP5 +, поддерживает недопустимый HTML и предоставляет очень простой способ обработки HTML-элементов.Найти теги на странице HTML с селекторами, как jQuery.Извлечение содержимого из HTML в одну строку.

Вот ссылка для его получения: http://sourceforge.net/projects/simplehtmldom/

... и вот официальный веб-сайт: http://simplehtmldom.sourceforge.net/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...