Я пишу что-то, что по существу уточняет и сообщает о различных строках из огромного python словаря (исходный файл для словаря XML длиной более миллиона строк).
Я нашел mongodb вчера и был рад видеть, что он легко принимает python словарей, как вам угодно ... пока он не отказался от моего, потому что объект dict превышает ограничение размера BSON в 16 МБ.
Я посмотрел на GridFS для se c, но он не примет объект python, у которого нет атрибута .read.
Со временем эта программа получит многие из этих мега-словарей; Я хотел бы записать каждый из них в базу данных, чтобы в какой-то момент я мог сравнить значения между ними.
Какой лучший способ справиться с этим? Я ужасно новичок во всем этом, но со мной все в порядке :) Кажется, что подход No SQL лучше; их структура общеизвестна, но может изменяться без уведомления. Схемы были бы кошмаром sh здесь.