Как получить полный комментарий к изображению, используя API википедии? - PullRequest
2 голосов
/ 30 октября 2011

Я беру некоторые метаданные изображения из API википедии, но заметил, что текст может быть обрезан.

На этой странице: http://en.wikipedia.org/w/api.php?action=query&prop=imageinfo&iiprop=comment&format=xml&titles=File:BrolinFoxFassbenderJonahHexJuly09.jpg

я вижу только:

{{OTRS pending|year=2009|month=August|day=16}} {{Information |Description={{en|Josh Brolin, Megan Fox, and Michael Fassbender promoting the 2010 film ''Jonah Hex'' at San Diego Comic-Con.}} |Source= http://www.flickr.com/photos/sdnatasha/3767292285/ |Date=

Если я смотрю на реальные данные для файла: http://commons.wikimedia.org/wiki/Special:Export/File:BrolinFoxFassbenderJonahHexJuly09.jpg

я вижу полную информацию:

== {{int:filedesc}} =={{Information|Description={{en|Josh Brolin, Megan Fox, and Michael Fassbender promoting the 2010 film ''Jonah Hex'' at San Diego Comic-Con.}}|Source= http://www.flickr.com/photos/sdnatasha/3767292285/|Date=2009-07-28|Author=NatashaBaucas at http://www.flickr.com/photos/sdnatasha/|Permission=Creative Commons Attribution|other_versions=}}{{Location dec|32.705573|-117.160391|}}== {{int:license}} =={{self|cc-by-2.0|author=Natasha Baucas}}{{PermissionOTRS|ticket= https://ticket.wikimedia.org/otrs/index.pl?Action=AgentTicketZoom&TicketID=3519937}}[[Category:MeganFox in 2009]][[Category:Josh Brolin]][[Category:Michael Fassbender]][[Category:2009 Comic-Con International]][[Category:Images uploaded by User:Nehrams2020]

Могу ли я использовать API википедии, чтобы получить не усеченные комментарии?

1 Ответ

3 голосов
/ 30 октября 2011

Комментарии, которые вы получаете с помощью iiprop=comment, представляют собой короткие фрагменты текста, показанные в таблице «История файлов», и причина, по которой они усекаются до 255 байт, заключается в том, что именно так они и хранятся в базе данных для начала..

Вместо этого вам нужно содержимое страницы описания файла, которое вы получаете так же, как и содержимое любой страницы: rvprop=content.

(Причина, по которой это так запутанно, в том, что интерфейс загрузки MediaWiki по умолчанию довольно странный. Комментарии к изображению действительно означают короткие заметки, похожие на редактирование сводок, но когда вы впервые загружаетеновое изображение, тот же текст, который вы вводите, используется и для содержимого страницы и для комментария к изображению. Если он слишком длинный, чтобы вписать комментарий - как это принято в Википедии в наши дни - комментарий усекается молча, но полный текст все еще входит в содержание страницы. Я думаю, кто-то думал, что это имеет смысл, когда этот интерфейс был впервые написан, описания изображений имеют тенденциюзначит, намного короче.)

...