Я работаю над проектом, который пытается сопоставить концепции DBpedia
со столбцами данных таблицы.В частности, я хотел отобразить литерал (числовые значения; float, int ..).Поэтому мне нужно достаточное количество данных для создания фоновой базы знаний.Я извлекаю некоторые данные из T2D-golden-dataset
в качестве данного формата в конце этого описания.На самом деле я должен использовать их в качестве контрольного показателя для тестирования, и он содержит только менее 20 столбцов из общих таблиц.Может ли кто-нибудь помочь мне найти такой буквально ценный и dbpedia
аннотированный набор данных?
Литературные диапазоны dbpedia;
"http://www.w3.org/2001/XMLSchema#float"
"http://www.w3.org/2001/XMLSchema#integer"
"http://www.w3.org/2001/XMLSchema#positiveInteger"
"http://www.w3.org/2001/XMLSchema#integer"
Некоторые свойства, имеющие эти диапазоны;
"http://dbpedia.org/ontology/speaker",
"http://dbpedia.org/ontology/ranking",
"http://dbpedia.org/ontology/humanDevelopmentIndex",
"http://dbpedia.org/ontology/numberOfPlatformLevels",
"http://dbpedia.org/ontology/enginePower",
"http://dbpedia.org/ontology/graySubject",
"http://dbpedia.org/ontology/shareOfAudience",
"http://dbpedia.org/ontology/percentageLiteracyWomen",.........
Примеры примеров, которые мне нужно найти или как-то сгенерировать, - это массив, соответствующий понятиямдано выше.Например:
"http://dbpedia.org/ontology/enginePower" : ["220", "125", "1300",....],
"http://dbpedia.org/ontology/humanDevelopmentIndex" : ["0.34", "0.78", "0.98", ...]
Мне не нужен этот точный формат.Было бы замечательно, если бы я мог найти достаточное количество таблиц данных, заданных как T2D golden dataset
для dbpedia
.