RAILS3: полнотекстовый поиск Word Docs? - PullRequest
0 голосов
/ 14 июля 2011

В моей компании собрано около 3500 высокоструктурированных документов Word (и продолжает расти), которые содержат вопросы с несколькими вариантами ответов по одному из наших продуктов.Мне было поручено написать интерфейс, который позволит людям находить и использовать их в других продуктах.На них есть некоторые метаданные, которые будут добавлены в базу данных, но мы также хотели бы полнотекстовый поиск.

Мне дали возможность использовать для внешнего интерфейса либо MS Access (потому что язнаю это хорошо) или Rails (потому что я должен изучать это).Я сделал одно приложение на Rails и предпочитаю продолжать его.

Вместо того, чтобы загружать документы в базу данных, я подумал, что было бы разумнее просто поместить их в файловую систему ихранить пути к ним в базе данных.

Я знаю, что могу использовать Ferret для поиска по полям базы данных, но как лучше всего добавить полнотекстовый поиск в приложение Rails для кучи файлов в файловой системе?

1 Ответ

0 голосов
/ 15 июля 2011

Не уверен, есть ли какие-нибудь драгоценные камни, которые будут искать файлы слов для вас.Хотя вы упомянули, что не хотите загружать все документы в базу данных, вы можете просто скопировать текстовое содержимое каждого файла в вашей базе данных.Вы можете использовать библиотеку win32ol для этого (http://ruby -doc.org / stdlib / libdoc / win32ole / rdoc / classes / WIN32OLE.html) .. Если бы мне пришлось это реализовать, я бы запускал задание cron каждую ночь (илис любой подходящей частотой) это обновит содержимое базы данных изменениями в файлах слов.

...