Question

Я хочу проанализировать файл pdf так, чтобы я мог идентифицировать заголовок каждой статьи и ее описание. Так что я могу хранить текст заголовка и текст описания в кеше для целей поиска. Есть ли библиотека или инструмент для этого?

arbiter · Answer 1 · 29 июня 2009

Сначала вы можете установить Adobe Pdf IFilter dll. Затем вы можете прочитать свойства из любого файла .pdf, используя эту библиотеку (используя IFilter в C #). Или же вы также можете заглянуть в эту библиотеку (Реализация TextReader для извлечения различного содержимого файлов с использованием IFilter).

точка нет: мне нужно проанализировать файл PDF, чтобы получить каждую статью с ее названием?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

точка нет: мне нужно проанализировать файл PDF, чтобы получить каждую статью с ее названием?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы