Как человек, который обрабатывает тысячи случайных PDF-файлов из разных клиентов каждый месяц, XpdfText , безусловно, является лучшей библиотекой для извлечения текста, по моему опыту. Мы также используем iTextSharp для различных задач, но не нашли такого же хорошего для извлечения текста.