PHP простой анализатор HTML Dom, как анализировать Javascript? - PullRequest
0 голосов
/ 18 июля 2011

Ну вот и мы,

Есть ли способ синтаксического анализа Javascript с помощью простого синтаксического анализатора HTML Dom в PHP? Я хочу анализировать веб-контент, сгенерированный Javascript, без прямого способа анализа изображений ... и т. Д., Поскольку они создаются после того, как Javascript его сгенерировал.

Вот веб-исходный код: view-source: http://www.pcbox.com/discos-duros_serial-ata-2---sata2_040507.aspx?ch=00000205110002000212031201fa80376ded0f8f1a2a036267416fe20#productos

и Интернет: http://www.pcbox.com/discos-duros_serial-ata-2---sata2_040507.aspx?ch=00000205110002000212031201fa80376ded0f8f1a2a036267416fe20#productos

Если вы проверяете источник, изображения ... и т. Д. Генерируются JavaScript, поэтому я не могу их разобрать напрямую. Есть ли парсер для PHP, который может это сделать?

1 Ответ

1 голос
/ 18 июля 2011

Нет.Вы можете только проанализировать DOM, как он существует.Для этого вам понадобится весь движок JavaScript, встроенный в парсер.Я полагаю, что это могло бы быть сделано с помощью других внешних инструментов (например, передача в файл node.js или что-то еще, а затем получение окончательного DOM обратно при разборе php), но это было бы очень сложно.попытайтесь создать js-анализатор для определенного набора вариантов использования, но это может привести к ошибкам, особенно если рассматриваемый html поступает с сайта, который вы не контролируете.

...