Какие инструменты доступны на рынке для индексирования документов и текста?
В идеале они должны попасть в эти категории .....
- Уметь работать в среде среднего доверия
- Быть открытым исходным кодом
- Уметь анализировать и вырезать текст из документов (pdf / office docs / docx)
- Уметь создавать фрагменты и выделять из поисковых запросов
- Уметь искать нечеткие фразы и т. Д.
Любая полезная информация также будет полезна.
Спасибо