Как добавить HTML и текстовые файлы в индекс Sphinx? - PullRequest
2 голосов
/ 02 декабря 2010

Из справочного руководства Sphinx: «Индексируемые данные обычно могут поступать из самых разных источников: базы данных SQL, простые текстовые файлы, файлы HTML , почтовые ящики и т. Д.»

Но я не могу найти, как добавить текстовые файлы и HTML-файлы в индекс. Краткий обзор использования Sphinx Показать настройки только для базы данных MySQL.

Как я могу это сделать?

Ответы [ 2 ]

2 голосов
/ 02 декабря 2010

Вам следует взглянуть на источник данных xmlpipe2 .

Из руководства:

xmlpipe2 позволяет передавать произвольные полныетекстовые и атрибутивные данные для Sphinx в еще одном пользовательском формате XML.Он также позволяет указать схему (т. Е. Набор полей и атрибутов) либо в самом потоке XML, либо в настройках источника.

0 голосов
/ 05 сентября 2011

Я бы предложил вам вставить текст в базу данных. Таким образом, вы сможете извлечь их и, вероятно, выделить результаты поиска намного проще и быстрее.

...