что вам нужно сделать, это сначала использовать инструмент для извлечения текста из PDF, а затем прочитать файл в двоичном считывателе ... затем сохранить его в своей базе данных ... для извлечения текста есть несколько инструментов, которые можно использовать.в первую очередь следует упомянуть:
iTextsharp , которая является библиотекой, которую можно
загрузить и которая используется для выполнения обширной работы и всестороннего редактирования и компоновки при работе с документами PDF, а такжеЕсть много примеров, доступных онлайн, а также полная книга, которая объясняет все тонкости Второй инструмент -
Adobe PDF iFilter - инструмент от Adobe для работы с PDF-модификациями и манипуляциями.
Также
Foxit iFilter также представляет собой аналогичную сборку, которая может сделать именно то, что вы просите!
PDF Box также послужит вам!
это самые известные и хорошо документированные!проверьте следующие примеры: попробуйте следующие примеры в проекте кода:
Анализ файлов PDF в .NET с использованием PDFBox и IKVM.NET. Простой класс для извлечения простого текста из PDFдокументы с ITextSharp Использование интерфейса IFilter для извлечения текста из документов различных типов Анализатор для PDF-форм, написанных на C # .NET Они делаютработа, и их нетрудно понять.Надеюсь, они вам помогут :-)
Последнее замечание: Что касается меня, я бы назвал iTextSharp, поскольку это самая хорошо документированная библиотека с большинством доступных примеров.