Нужно найти пробелы в файле PDF при преобразовании PDF в Excel, используя itextSharp - PullRequest
0 голосов
/ 06 марта 2019

Как получить точное содержимое из PDF в Excel, используя itextSharp?я написал код для преобразования pdf в excel.

string filepath = "filepath.PDF";
        string strText = string.Empty;
        List<string[]> list = new List<string[]>();
        string[] PdfData = null;
        try
        {
            PdfReader reader = new PdfReader((string)filepath);
            for (int page = 1; page <= reader.NumberOfPages; page++)
            {
                ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.LocationTextExtractionStrategy();
                String cipherText = PdfTextExtractor.GetTextFromPage(reader, page, its);
                byte[] content = reader.GetPageContent(page);
                string contentstring = Encoding.UTF32.GetString(content);
                cipherText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(cipherText)));

                string tcipherText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Unicode, Encoding.UTF8, Encoding.Unicode.GetBytes(cipherText)));
                strText = strText + "\n" + cipherText;
                PdfData = strText.Split('\n');

            }
            reader.Close();
        }

здесь я застрял с проблемой, текст Pdf вроде «Наши правила и положения».Мне нужно разобрать это как один столбец в Excel.

Не могли бы вы помочь кому-нибудь это исправить?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...