Кроме CouchDB и собственных баз данных XML (таких как eXist ), какие базы данных могут хранить и запрашивать неструктурированные и полуструктурированные данные?
Мне было передано много данных в разных форматах (XML, JSON, YAML, CSV, некоторые пользовательские форматы), с которыми мне нужно объединиться и работать, но разработка схемы в реляционной базе данных займет много времени и сложно.
В основном я смотрю на решения с открытым исходным кодом. Кроме того, в какой-то момент я бы хотел как-то сделать эти данные доступными.
Я понимаю, что будут некоторые издержки при преобразовании всех этих данных в общий формат для работы. Есть несколько хороших вариантов на фронте XML: eXist-db и BerkeleyDB-XML, кажется, имеют хорошую поддержку XQuery.
Кроме того, CouchDB, несмотря на свою молодость, выглядит многообещающе благодаря простому формату «документа».
Другие пути, на которые я смотрел, - это OODBMS, такие как ZODB и db4o; написать несколько простых сценариев синтаксического анализа, а затем просто сохранить полученный объект записи «как есть». Проблема заключается в том, чтобы опрашивать их потом; У OODBMS, похоже, нет хорошей истории механизмов запросов.
Что меня не интересует, так это решения типа "blobs-in -alal-db". Выглядит как хак и не учитывает эволюцию данных, индексацию FT и т. Д.
Есть ли другие решения, с которыми я не сталкивался?