Мы запускаем Solr на экземпляре Amazon Web Services EC2 с томом EBS объемом 1 ТБ для хранения индекса, чтобы мы могли легко запускать дополнительные серверы с таким же индексом (только для чтения).Тем не менее, наш индекс скоро превысит 1 ТБ, и я не хочу разбирать несколько томов EBS для хранения индекса.Кроме того, восстановление индекса происходит очень медленно.Я хотел бы перенести генерацию индекса - и, возможно, хостинг - на Hadoop, и, предпочтительно, на Amazon Elastic MapReduce, хотя в случае необходимости я могу настроить отдельные серверы Hadoop.Мы используем RightScale, поэтому нам доступна их библиотека ServerTemplates.
Как лучше всего начать использовать Lucene / Solr в Hadoop?