У меня есть набор данных размером около 11 ГБ, который содержит некоторые атрибуты, как показано ниже:
POS_ID,STATUS,LON,LAT,TIMESTAMP
116351,8,157.0625,-24.36573,2013-12-31 17:03:00.000
116357,0,148.9484,-20.34638,2013-12-31 17:03:00.000
116358,0,152.1151,-11.07703,2013-12-31 17:03:00.000
Я использовал две разные базы данных для хранения данных.Более конкретно:
MongoDB
Я конвертирую этот набор данных в формат GeoJSON, а затем индексирую (BTree) атрибут "POS_ID".
PostgreSQL
Я сохраняю набор данных в формате CSV, а затем снова индексирую (BTree) атрибут "POS_ID".
Я вижу, что размер индекса существенно различается между двумясистемы.В случае MongoDB размер индекса составляет 6 ГБ, а в PostgreSQL - 3,1 ГБ.
Если я индексирую атрибут «TIMESTAMP», размер индекса будет одинаковым для обеих баз данных.
Кто-нибудь знает в чем причина того, что в MongoDB размер индекса почти в 2 раза больше?И во втором случае, по какой причине индексы имеют одинаковый размер?