Индексирование документов PDF - PullRequest
2 голосов
/ 18 сентября 2010

Каков наилучший способ индексирования PDF-документов?Должен ли я индексировать их путем преобразования PDF-документов в TXT или есть лучший способ индексировать PDF-файлы?

1 Ответ

3 голосов
/ 18 сентября 2010

Если вы говорите о solr: см. ExtractingRequestHandler .

...