Как получить точное содержимое из PDF в Excel, используя itextSharp?я написал код для преобразования pdf в excel.
string filepath = "filepath.PDF";
string strText = string.Empty;
List<string[]> list = new List<string[]>();
string[] PdfData = null;
try
{
PdfReader reader = new PdfReader((string)filepath);
for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.LocationTextExtractionStrategy();
String cipherText = PdfTextExtractor.GetTextFromPage(reader, page, its);
byte[] content = reader.GetPageContent(page);
string contentstring = Encoding.UTF32.GetString(content);
cipherText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(cipherText)));
string tcipherText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Unicode, Encoding.UTF8, Encoding.Unicode.GetBytes(cipherText)));
strText = strText + "\n" + cipherText;
PdfData = strText.Split('\n');
}
reader.Close();
}
здесь я застрял с проблемой, текст Pdf вроде «Наши правила и положения».Мне нужно разобрать это как один столбец в Excel.
Не могли бы вы помочь кому-нибудь это исправить?