Есть ли способ разобрать вики-страницу обсуждения? - PullRequest
1 голос
/ 17 апреля 2020

Я искал комментарии, сделанные редакторами на странице обсуждения Википедии вместе с именем редактора и отметкой времени (например, https://en.wikipedia.org/wiki/Talk: Coronavirus ). Есть ли какой-нибудь значимый способ сделать это вообще? Могут ли комментарии быть извлечены при сохранении древовидной структуры, то есть, был ли комментарий в ответ на другой комментарий.

Спасибо!

1 Ответ

2 голосов
/ 21 апреля 2020

Только приблизительно. Есть инструменты, которые пытаются это сделать, например python -mwchatter , но в целом это викитекст произвольной формы, поэтому нет надежного метода извлечения структуры из него.

...