Где найти набор данных с литеральными данными, уже аннотированными концепциями свойств dbpedia (с диапазоном в float или int)? - PullRequest
0 голосов
/ 15 мая 2019

Я работаю над проектом, который пытается сопоставить концепции DBpedia со столбцами данных таблицы.В частности, я хотел отобразить литерал (числовые значения; float, int ..).Поэтому мне нужно достаточное количество данных для создания фоновой базы знаний.Я извлекаю некоторые данные из T2D-golden-dataset в качестве данного формата в конце этого описания.На самом деле я должен использовать их в качестве контрольного показателя для тестирования, и он содержит только менее 20 столбцов из общих таблиц.Может ли кто-нибудь помочь мне найти такой буквально ценный и dbpedia аннотированный набор данных?

Литературные диапазоны dbpedia;

"http://www.w3.org/2001/XMLSchema#float"
"http://www.w3.org/2001/XMLSchema#integer"
"http://www.w3.org/2001/XMLSchema#positiveInteger"
"http://www.w3.org/2001/XMLSchema#integer"

Некоторые свойства, имеющие эти диапазоны;

"http://dbpedia.org/ontology/speaker",
"http://dbpedia.org/ontology/ranking",
"http://dbpedia.org/ontology/humanDevelopmentIndex",
"http://dbpedia.org/ontology/numberOfPlatformLevels",
"http://dbpedia.org/ontology/enginePower",
"http://dbpedia.org/ontology/graySubject",
"http://dbpedia.org/ontology/shareOfAudience",
"http://dbpedia.org/ontology/percentageLiteracyWomen",.........

Примеры примеров, которые мне нужно найти или как-то сгенерировать, - это массив, соответствующий понятиямдано выше.Например:

 "http://dbpedia.org/ontology/enginePower" : ["220", "125", "1300",....],
 "http://dbpedia.org/ontology/humanDevelopmentIndex" : ["0.34", "0.78", "0.98", ...]

Мне не нужен этот точный формат.Было бы замечательно, если бы я мог найти достаточное количество таблиц данных, заданных как T2D golden dataset для dbpedia.

1 Ответ

0 голосов
/ 29 мая 2019

Этот запрос запускает вас в будущем, поскольку он получает 100 напечатанных литеральных значений для <http://dbpedia.org/ontology/populationTotal>, которые все набираются как <http://www.w3.org/2001/XMLSchema#nonNegativeInteger> -

PREFIX  dbo:  <http://dbpedia.org/ontology/>

SELECT DISTINCT ?value
WHERE 
  { ?subject dbo:populationTotal ?value } 
LIMIT 100

Этот довольно сложный (и дорогой) запрос дает вам что-то вроде конечного результата. Я думаю, что вы хотите - но вам придется запускать его несколько раздля нескольких предикатов за раз, чтобы получить все, о чем вы просите, из общедоступной конечной точки.При необходимости вы можете развернуть свой собственный экземпляр зеркала DBpedia в облаке AWS и настроить время ожидания Virtuoso и другие ограничения, чтобы создать и запустить один запрос, который даст один гигантский набор результатов.

PREFIX  xsd:  <http://www.w3.org/2001/XMLSchema#>
PREFIX  dbo:  <http://dbpedia.org/ontology/>

SELECT # DISTINCT ?predicate ?value ?value_type ?value_str
                  ?predicate ?value_type ( GROUP_CONCAT ( DISTINCT ?value_str ; separator=", " ) AS ?values )
WHERE 
  { ?subject  ?predicate  ?value 
    VALUES ( ?predicate ) { ( dbo:numberOfPlatformLevels )
                            ( dbo:shareOfAudience )
                            ( dbo:populationTotal ) 
                          }
      BIND ( DATATYPE ( ?value ) AS ?value_type )
      BIND (      STR ( ?value ) AS ?value_str )
  } 
GROUP BY ?predicate ?value_type
ORDER BY ?predicate ?value_type
LIMIT 1000
...