Наша установка такая. Мы эмулируем то, что традиционно понимается как реляционная база данных (с одним-многими соединениями между сущностями), имея два индекса SOLR. Один из них (A) хранит документы с полями, логически приписанными каждому документу в другом (B). Мы не только устанавливаем отношения, но и (я считаю) спасают индексы от ненужного роста.
На текущий момент мы оцениваем объединение обоих индексов так, что каждое поле документа (id = i) в A будет скопировано в каждый документ (foreign_key = i) из B. После этого A больше не нужен. *
Мой вопрос: оптимизирует ли SOLR хранение часто повторяющихся значений во всем индексе? Приведет ли слияние в таком сценарии к раздутию B?
Отношение один ко многим от A до B имеет в среднем 10 тыс. Ссылок.