Википедия API: получить только анализируемое введение - PullRequest
2 голосов
/ 18 марта 2011

Используя PHP, есть ли хороший способ получить (проанализированное) введение только со страницы википедии?

У меня есть текущие методы:

  • Во-первых, нужно вызвать страницу API и вернуться, а затем вызвать анализатор Wiki для введения, которое я извлек из первого запроса (два запроса, извлечение вступления из текста тоже не очень).
  • Второй - вызвать синтаксический анализатор всей страницы и использовать xpath для извлечения каждого тега <p> перед таблицей содержимого.

При использовании обоих методов мне необходимо повторно проанализировать HTML-код, чтобы убедиться, что соответствующие ссылки внутри вступительной ссылки отключены на википедию.

Ни один из них не идеален на самом деле, должен быть лучший способ?

1 Ответ

1 голос
/ 19 марта 2011

Модуль API action=parse принимает параметр номера раздела, , например .Ведущий - секция № 0.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...