PHP Simple HTML DOM Parser отказывается обрабатывать [недопустимый] HTML - первая пробная неудача - PullRequest
1 голос
/ 24 мая 2011

г день уважаемое сообщество - всем привет!

Я пытаюсь выбрать класс или идентификатор с помощью PHP Simple HTML DOM Parser, но безуспешно.Возможно, мне придется изучать руководства снова и снова.

Что ж, DOM-техника в некотором роде зашкаливает: но мой пример очень прост и, кажется, соответствует примерам, приведенным в руководстве (simplehtmldom.sourceforge AT net / manual.htm), но это просто неработа, это ведет меня вверх по стене.Другие примеры сценариев с простым dom работают нормально.

См. Пример: http://www.aktive -buergerschaft.de / buergerstiftungsfinder

Это самый простой пример, который я нашел... Вопрос - как разобрать это?

Должен ли я сделать это с Perl - пример HTML-страницы недействителен HTML.Я не знаю, способен ли Simple HTML DOM Parser обрабатывать плохо искаженный HTML (вероятно, нет).И тогда я потерялся.

Хорошо: в это довольно сложно поверить - но вы можете получить контент с помощью file_get_contents: Но впоследствии вам придется выполнять работу парсера!И там у меня есть некоторые недостающие части!

Наконец: если я не могу запустить его, я могу попробовать некоторые парсеры Perl, например, HTML :: TreeBuilder :: XPath

1 Ответ

1 голос
/ 24 мая 2011

1: проверьте, работает ли file_get_contents !!!!

2: Если для чтения данных не используются curl, fopen или telnet.

Simple Html Dom отфильтровывает весь шум, который может обработатьтакже неправильно сформированные теги ...

Возможно, проблема с получением данных

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...