Мне нужно создать приложение на C # или C ++ (MFC), которое конвертирует pdf файлы в txt. Мне нужно не только конвертировать, но и удалять заголовки, нижние колонтитулы, некоторые символы мусора на левом поле и т. Д. Таким образом, приложение shold позволяет пользователю устанавливать поля страницы, чтобы обрезать ненужное. На самом деле я уже создал такое приложение с использованием xpdf, но у меня возникают некоторые проблемы, когда я пытаюсь вставить пользовательские теги в извлеченный текст, чтобы сохранить курсив и жирный шрифт. Может быть, кто-нибудь может предложить что-то полезное?
Спасибо.