Хранение индекса Lucene в базе данных BigTable - PullRequest
0 голосов
/ 30 сентября 2019

У меня есть база данных BigTable, которая содержит данные из разных источников, и я пытаюсь проиндексировать все данные с помощью Lucene.

Создание индекса не должно быть проблемой, если мне удастся правильно запросить базу данных, но когда дело доходит до хранения индекса, я действительно запутался. Я провел небольшое исследование и нашел два возможных способа: хранить их на жестком диске, который удобен для хранения индекса большого размера, но медленнее при поиске, или сохранять их в оперативной памяти, что быстро при поиске, но дорогокогда дело доходит до размера.

Я нашел и попробовал много примеров сохранения индекса на жестком диске, но я не могу найти пример, который дает возможное решение для производственной среды (ни Hdd, ниРам, похоже, прав).

Я обнаружил, что эти 2 старые ссылки link1 link2 говорят о возможной конкретной реализации, которая интегрирует Lucene с Hbase. В случае BigTable, может ли конкретная реализация быть единственным решением?

...