Question

Вот что я пытаюсь сделать, используя API Википедии (MediaWiki) - http://en.wikipedia.org/w/api.php

Выполните GET на http://en.wikipedia.org/w/api.php?format=xml&action=opensearch&search=[keyword], чтобы получить список предлагаемых страниц для ключевого слова
Перебирайте каждую предложенную страницу, используя GET для http://en.wikipedia.org/w/api.php?format=json&action=query&export&titles=[page title]
Извлечение всех найденных на странице абзацев в массив
Делать что-то с массивом

Я застрял на # 3. Я могу видеть кучу данных JSON, которые включают между собой "\ n \ n" между абзацами, но по какой-то причине функция PHP explode () не работает.

По сути, я просто хочу взять «мясо» каждой страницы Википедии (не заголовки или любое форматирование, а просто содержимое) и разбить его по абзацам на массив.

Есть идеи? Спасибо!

Emil Vikström · Answer 1 · 21 мая 2010

\n\n - это буквально те символы, а не переводы строк. Убедитесь, что вы используете одинарные кавычки вокруг строки в explode:

$parts = explode('\n\n', $text);

Если вы решите использовать двойные кавычки, вам придется экранировать символы \, например:

$parts = explode("\\n\\n", $text);

Примечание: почему вы извлекаете данные в двух разных форматах? Почему бы не использовать только JSON или только XML?

Извлечение абзацев из API Википедии с использованием PHP cURL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Извлечение абзацев из API Википедии с использованием PHP cURL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы