Как получить простой текст из подкатегории Wiki API - PullRequest
0 голосов
/ 20 января 2019

Я не могу получить простой текст из подкатегории через API Wiki.

Я использую

https://en.wikipedia.org/w/api.php?action=query&titles=Submarine&section=4&prop=extracts&explaintext&exsectionformat=plain&redirects

, чтобы получить реферат сайта из Вики.Теперь я хотел бы получить только содержание, скажем, 4-го раздела.Я попытался, просто добавив:

&section=4

Независимо от того, что я пытаюсь, это просто кажется отклоненным.Хотя я могу получить содержимое раздела, используя:

https://en.wikipedia.org/w/api.php?action=parse&page=Submarine&prop=wikitext&explaintext&exsectionformat=plain&&format=json&origin=*&action=parse&section=4

Но тогда я не смогу получить свой текст без вики-разметки.

Скорее всего, решение представляет собой комбинацию этих двух подходов, но я просто не могу обернуться вокруг него ...

Эти документы могут помочь.

Любая помощь высоко ценится!

1 Ответ

0 голосов
/ 26 января 2019

Я нашел решение!

После борьбы с ответом, который дал мне @Tgr, я наткнулся на потрясающий JS lib: wtf_wikipedia . Я надеюсь, что Вики решит дать этому человеку медаль! Взять, к примеру, текст 8-й категории так же просто, как это:

doc.sections(8).text()
...