Разбор содержимого Wiki API - PullRequest
1 голос
/ 28 июня 2011

У меня есть эта вики из API http://fr.wikipedia.org/w/api.php?action=query&titles=%C9rythropo%EF%E9tine&prop=revisions&rvprop=content&format=xmlfm

, которую я хотел бы получить из основного содержимого, начиная с:

L''''érythropoïétine''' ('''EPO''') est une [[hormone]] ......etc

Я пытался для начала preg_replace все изначало, начинающееся со слова "{{Chimiebox ...", внизу "}}", используя это

preg_replace( '/^{{(.*)}}$/sim', '', $value[0]['*'] );

Но это не сработает. Кто-нибудь знает хороший способ определитьначало содержания ??Спасибо за любой совет.

1 Ответ

0 голосов
/ 28 июня 2011

Ну, на самом деле, большинство проектов используют парсер Wikipedia напрямую, например. Проект Wikipedia Offline Client в моем университете. Поскольку вы, похоже, используете php, это может быть самый простой способ для вас.

...