Используя PHP, есть ли хороший способ получить (проанализированное) введение только со страницы википедии?
У меня есть текущие методы:
- Во-первых, нужно вызвать страницу API и вернуться, а затем вызвать анализатор Wiki для введения, которое я извлек из первого запроса (два запроса, извлечение вступления из текста тоже не очень).
- Второй - вызвать синтаксический анализатор всей страницы и использовать
xpath
для извлечения каждого тега <p>
перед таблицей содержимого.
При использовании обоих методов мне необходимо повторно проанализировать HTML-код, чтобы убедиться, что соответствующие ссылки внутри вступительной ссылки отключены на википедию.
Ни один из них не идеален на самом деле, должен быть лучший способ?