Получить первый абзац статьи в Википедии - PullRequest
2 голосов
/ 22 февраля 2012

Я пытался понять документацию MediaWiki за последние 2 дня, и я не могу понять, как получить первый абзац статьи в Википедии через API MediaWiki.

Может кто-нибудь указать мнев правильном направлении?

Я собираюсь обратиться к file_get_contents, но я уверен, что есть "более чистое" решение.

Ответы [ 2 ]

2 голосов
/ 22 февраля 2012

file_get_contents довольно чистый, вы получите HTML-код. Затем вы можете проанализировать HTML-код, используя DOMDocument. DOMDocument работает как javascript, например, вы можете получить все <p> в div. Или возьмите первый.

например:

$html = file_get_contents('the url');

$dom = new DomDocument();
@$dom->loadHTML($html);

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;
1 голос
/ 23 февраля 2012

Не пытайтесь использовать raw API, вместо этого используйте клиентскую оболочку. Вот длинный список на выбор, все для PHP:

http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table

...