Из справочного руководства Sphinx: «Индексируемые данные обычно могут поступать из самых разных источников: базы данных SQL, простые текстовые файлы, файлы HTML , почтовые ящики и т. Д.»
Но я не могу найти, как добавить текстовые файлы и HTML-файлы в индекс. Краткий обзор использования Sphinx Показать настройки только для базы данных MySQL.
Как я могу это сделать?
Вам следует взглянуть на источник данных xmlpipe2 .
Из руководства:
xmlpipe2 позволяет передавать произвольные полныетекстовые и атрибутивные данные для Sphinx в еще одном пользовательском формате XML.Он также позволяет указать схему (т. Е. Набор полей и атрибутов) либо в самом потоке XML, либо в настройках источника.
Я бы предложил вам вставить текст в базу данных. Таким образом, вы сможете извлечь их и, вероятно, выделить результаты поиска намного проще и быстрее.