Использовать бесплатные данные на локальном сервере? - PullRequest
9 голосов
/ 29 января 2011

Существуют ли какие-либо способы использования дампов данных freebase для создания базы данных, аналогичной той, которую предлагает freebase, но на вашем собственном сервере? Довольно много, но локально, а не через API?

Полагаю, можно было бы создать, но уже есть какие-то решения для этого? Или какие-либо альтернативные решения для аналогичных данных без использования API? Я не нашел это и для dbpedia: |

Ответы [ 5 ]

7 голосов
/ 11 марта 2012

Альтернатива freebase-quad-rdfize находится здесь: https://github.com/castagna/freebase2rdf

Я использую хранилище TDB Apache Jena для загрузки данных RDF и Fuseki для обслуживания данных по протоколу SPARQL по HTTP.

См. Также:

Более того, теперь у вас есть еще один вариант: http://basekb.com/

3 голосов
/ 31 мая 2012

Я создатель : BaseKB , первого пригодного для использования преобразования Freebase в RDF.

В четырехстороннем дампе Freebase есть ключевые проблемы с целостностью, которые затрудняют получение полностью правильных результатов из четырехстороннего дампа. : BaseKB реконструирует ключевую структуру Freebase, так что допущение уникального имени сохраняется. Это важно, потому что от этого зависит возможность писать простые запросы SPARQL, которые работают как запросы SQL.

Прямо сейчас: BaseKB существует в двух редакциях. Есть бесплатное издание, которое состоит из 120 миллионов фактов и около 4 миллионов тем (из Википедии), и есть издание «Про», которое содержит все.

Что касается проблем с производительностью, возникших у Филиппа Кендалла, я могу сказать, что это в основном вопрос наличия достаточного объема ОЗУ. С 24 ГБ ОЗУ я могу загрузить бесплатную версию в тройной магазин за час. Некоторые запросы занимают больше времени, чем мне нравится, но общая производительность запросов хорошая.

Любой, кто хочет использовать версию "Pro", будет нуждаться в необычайно мощном оборудовании и потратит немало усилий, чтобы заставить работать свой инструментарий. Сейчас я работаю с партнерами, чтобы доставить «Pro» пользователям удовлетворительным образом.

3 голосов
/ 31 января 2011

Взгляните на проект freebase-quad-rdfize в Google Code.Это должно позволить вам загрузить еженедельный Freebase quad dump и загрузить его в тройной магазин RDF по вашему выбору.

2 голосов
/ 29 января 2011

Импорт данных в тройное хранилище по вашему выбору не составит труда, но у вас будут большие трудности с получением ответов в разумные сроки, если вы не сделаете что-то тривиальное.импортировать весь набор данных в MySQL несколько лет назад - загрузка заняла 2 недели, и даже простые запросы, такие как «количество вещей, набранных как человек», заняли> 1 минуту, чтобы дать ответ.Это было на большом оборудовании, и набор данных теперь намного больше, чем был тогда.

1 голос
/ 29 января 2011

Если вы можете экспортировать базу данных в значения TXT или файлы базы данных, такие как MDB, XLS или любой другой формат данных с высокой переносимостью, в таблицу, скажем, с разделителями табуляции или через запятую, у вас не возникнет проблем при создании собственной базы данных MySQL на вашем компьютере. компьютер с использованием этих данных. Главное, чтобы вы могли экспортировать данные, из которых вы можете перестроить свою собственную базу данных.

...