Я работаю над переносом моего старого инструмента индексирования в solr (версия 7).Но я не совсем уверен, как мне проиндексировать мои файлы для Solr.
Данные в нашей системе расположены в oracle DB, mysql и cassendra.Но обновления в этих БД встречаются не так часто (2-3 раза за 24 часа), и они будут источником моих файлов индекса solr.
В одной из коллекций у меня будет около 300–400 тыс. Записей, а в другой - около 5 тыс.
Я мог бы предложить 2 метода.
- Создать ETL-конвейер из источника данных diff с помощью Apache Storm.
- Использовать Kafka для подключения источника и приемника.
какая из 2 хороша для такой системы, как наша?или оба метода избыточны для системы, подобной нашей?