Я пытаюсь извлечь только один элемент div, имеющий id=MainText
из этой страницы . Однако, когда я загружаю содержимое этой страницы в объект DOM, я получаю несколько ошибок:
Tag g:plusone invalid...
Unexpected end tag...
htmlParseEntityRef: no name ...
htmlParseEntityRef: expecting ';' ...
Итак, я подумал, можно ли игнорировать все остальные вещи из документа и перейти прямо к той части, которую я хочу, получить только элемент div с этим конкретным идентификатором.
Или есть ли альтернатива использованию класса domdocument для достижения того же? Я не очень хорошо пишу регулярные выражения.