Python: выберите страницы Википедии о местах и ​​местах, используя Викиданные - PullRequest
1 голос
/ 25 февраля 2020

У меня есть список страниц Википедии, связанных с некоторыми объектами, и я хочу выбрать только географические места и местоположения (города, провинции, но также регионы, горы, реки и т. Д.).

Я могу легко выбирать страницы с координатами, но этого недостаточно, поскольку многие места в Википедии не связаны с их координатами. Я думаю, что я должен использовать метки из Викиданных, но я никогда не использовал их, и я немного потерян с Python API. Например, если я использую wptools:

import wptools
page = wptools.page('Indianapolis')
print(page.get_wikidata())

, я получаю это:

www.wikidata.org (wikidata) Indianapolis
www.wikidata.org (labels) Q1000136|P1830|P421|Q1093829|P163|Q2579...
www.wikidata.org (labels) Q537853|P281|P949|Q2494513|Q3166162|Q18...
www.wikidata.org (labels) P1036|Q499547|P1997|P31|P17|P268|Q62049...
en.wikipedia.org (imageinfo) File:IndianapolisC12.png
Indianapolis (en) data
{
  aliases: <list(10)> Circle City, Indy, Naptown, Crossroads of Am...
  claims: <dict(61)> P1082, P227, P1151, P31, P17, P131, P163, P41...
  description: <str(109)> city in and county seat of Marion County...
  image: <list(1)> {'file': 'File:IndianapolisC12.png', 'kind': 'w...
  label: Indianapolis
  labels: <dict(145)> Q1000136, P1830, P421, Q1093829, P163, Q2579...
  modified: <dict(1)> wikidata
  requests: <list(5)> wikidata, labels, labels, labels, imageinfo
  title: Indianapolis
  what: county seat
  wikibase: Q6346
  wikidata: <dict(61)> population (P1082), GND ID (P227), topic's ...
  wikidata_pageid: 7459
  wikidata_url: https://www.wikidata.org/wiki/Q6346
}

Как я могу извлечь только метки? Я полагаю, что существует ярлык «ЭТО МЕСТО», но как его использовать? Заранее спасибо

...