точка нет: мне нужно проанализировать файл PDF, чтобы получить каждую статью с ее названием? - PullRequest
0 голосов
/ 29 июня 2009

Я хочу проанализировать файл pdf так, чтобы я мог идентифицировать заголовок каждой статьи и ее описание. Так что я могу хранить текст заголовка и текст описания в кеше для целей поиска. Есть ли библиотека или инструмент для этого?

1 Ответ

1 голос
/ 29 июня 2009

Сначала вы можете установить Adobe Pdf IFilter dll. Затем вы можете прочитать свойства из любого файла .pdf, используя эту библиотеку (используя IFilter в C #). Или же вы также можете заглянуть в эту библиотеку (Реализация TextReader для извлечения различного содержимого файлов с использованием IFilter).

...