Как я могу читать файлы PDF и сохранять содержимое в текстовый файл, используя Spire.PDF?Например: вот pdf файл , а вот желаемый текстовый файл из этого pdf
Я попробовал приведенный ниже код, чтобы прочитать файл и сохранить его втекстовый файл
PdfDocument doc = new PdfDocument();
doc.LoadFromFile(@"C:\Users\Tamal\Desktop\101395a.pdf");
StringBuilder buffer = new StringBuilder();
foreach (PdfPageBase page in doc.Pages)
{
buffer.Append(page.ExtractText());
}
doc.Close();
String fileName = @"C:\Users\Tamal\Desktop\101395a.txt";
File.WriteAllText(fileName, buffer.ToString());
System.Diagnostics.Process.Start(fileName);
Но выходной текстовый файл неправильно отформатирован.У него есть лишние пробелы и полный параграф разбит на несколько строк и т. Д.
Как получить желаемый результат, как в желаемом текстовом файле ?
Кроме того, онМожно ли обнаружить и пометить (например, добавить метку) тексты жирным шрифтом, курсивом или подчеркиванием?Кроме того, все становится более проблематичным, поскольку страницы содержат несколько столбцов текста.