Как получить тип шаблона записи в Википедии - PullRequest
0 голосов
/ 07 февраля 2011

Мне нужно выяснить тип шаблона записи на странице Википедии. До этого момента я полагался на анализ результатов запроса в Википедии, который работает до определенного момента.

Например, если я ищу Джоэл Спольски , я могу откорректировать совпадение с 'инфобоксом' и выяснить, что эта страница относится к человеку с инфобоксом .

Но проблема в том, что нет единой схемы именования для типов шаблонов в Википедии, и «инфобокс» часто не используется в названии шаблона.

Например, если я ищу Питтсбург Стилерс , я не могу надежно найти способ извлечь шаблон команды НФЛ из результатов.

Кто-нибудь знает способ запроса типа шаблона страницы Википедии? Спасибо:)

Ответы [ 2 ]

1 голос
/ 07 февраля 2011

Самый простой способ - смотреть на категории страницы, а не на шаблоны.Например, у Джоэла Спольски категория «Живые люди», а у Питтсбурга Стилерс категория «Команды Национальной футбольной лиги».

0 голосов
/ 09 июля 2012

Может быть DBpedia может помочь.DBpedia etxracts структурированные данные из Википедии, предлагает их для загрузки и сохраняет их в общедоступной базе данных.Например, попробуйте следующий запрос на http://dbpedia.org/sparql:

select distinct ?t where {
  ?t a <http://dbpedia.org/ontology/AmericanFootballTeam> .
}

. Возвращает все команды американского футбола, известные DBpedia, в формате RDF.В настоящее время почти все языки имеют RDF API, поэтому получение данных, которые вам нужны, должно быть относительно простым.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...