Мое приложение Django должно иметь возможность поиска больших объемов журналов чата, которые хранятся в другой базе данных Postgres, то есть в другой, отличной от базы данных моего Django. Изначально пользователи на сайте использовали простой полнотекстовый поиск в журналах, но позже мы намерены проанализировать эти журналы с использованием NLP.
Что будет лучшим вариантом индексации в этом случае - Sphinx или Solr?
Я ищу что-то, что FOSS хорошо масштабируется, поддерживает NLP и имеет хорошие привязки Python / Django, если у кого-то из вас нет лучшего способа / инструмента для этого.
Извините, если я что-то не так понял выше. Я новичок в концепции реализации чего-либо подобного и стараюсь как можно быстрее понять их.