Получение идентификаторов Википедии на MQL - PullRequest
1 голос
/ 04 ноября 2011

Freebase WEX dumps содержит столбец wpid, соответствующий page_id из исходной базы данных MediaWiki в таблице freebase_wpid. В этой таблице показано соответствие между числовыми идентификаторами статей / редиректов Википедии и идентификаторами Freebase GUID (глобальные уникальные идентификаторы).

guid использование в качестве внешних ключей устарело на mid для многих веских причин , но это не меняет того факта, что направляющие по-прежнему используются на системном уровне, поэтому я собираюсь позвонить mid с этого момента.

Использование средства доступа mid является гибким в MQL. Можно запросить, используя "mid": null и "mid":[] в зависимости от того, нужен ли вам текущий mid или каждый mid.

Найти список wpid значений для mid просто в MQL:

[{
  "mid": null
  "key": [{"namespace":"/wikipedia/en_id", "value":null}]
}]

Но если во вселенной все хорошо, каждый ток mid должен иметь только один ток wpid, так есть ли способ сделать что-то вроде "wpid": null, как можно с помощью аксессора mql?

1 Ответ

2 голосов
/ 04 ноября 2011

Если вам нужно только одно значение wpid на середину, вы можете сделать что-то вроде этого:

[{
  "mid": null,
  "key": {
    "namespace": "/wikipedia/en_id",
    "value":     null,
    "limit":     1
  }
}]​

Попробуйте это

Имейте в виду, что оно полностьюВозможно, что тема Freebase будет иметь более одного wmid.Это происходит всякий раз, когда нам нужно объединить дубликаты тем, которые мы импортировали из Википедии, или если мы импортируем их до того, как они будут объединены в Википедии.

Если вы ищете ссылки на страницы Википедии, вас может заинтересоватьв пространстве имен / wikipedia / en_title:

[{
  "mid": null,
  "key": {
    "namespace": "/wikipedia/en_title",
    "value":     null,
    "limit":     1
  }
}]​

Попробуйте

...