Я хочу проанализировать файл pdf так, чтобы я мог идентифицировать заголовок каждой статьи и ее описание. Так что я могу хранить текст заголовка и текст описания в кеше для целей поиска. Есть ли библиотека или инструмент для этого?
Сначала вы можете установить Adobe Pdf IFilter dll. Затем вы можете прочитать свойства из любого файла .pdf, используя эту библиотеку (используя IFilter в C #). Или же вы также можете заглянуть в эту библиотеку (Реализация TextReader для извлечения различного содержимого файлов с использованием IFilter).