Ключевые данные хранятся в MARKLOGIC_DATA_DIR (зависит от вашей установки) в подкаталоге Forests/<Forest Name>/
вместе с неключевыми данными.Ключевые и неключевые данные являются зависимыми.Если вы намерены оценить, сколько дополнительного дискового пространства потребуется, если вы добавите новый индекс, возьмите размер всех каталогов лесов для вашей базы данных без этого индекса, затем добавьте индекс и вычтите.
Да, я знаю, что это не похоже на «оценку».Все остальное - грубое предположение.
Для «грубого предположения» - «это зависит» - и любое предположение следует нормализовать, попробовав его.В основном типичный размер текстового индекса соответствует the number of distinct terms * 8 * num-docs-that-have-that-term
.
Каждая запись индекса будет содержать как минимум одно 64-битное значение для каждого документа, содержащего этот термин.Кроме того, он (возможно, совместно с другими индексами) будет хранить закодированную версию этого термина.
Это «грубое предположение» может быть отключено в 10 раз или более - в зависимости от вида индекса и распределения данных,сжатие, шифрование и т. д. Следовательно, вы должны действительно сравнивать до и после индексации похожих индексов.