Как я могу удалить пробелы в словах? (itextSharp, PdfReader, C#, ASP. NET) - PullRequest
1 голос
/ 03 мая 2020

Когда я передаю pdf файлы в текстовое поле с помощью itextsharp (PdfReader), весь текст моего pdf выглядит следующим образом: слово (длинный пробел) слово (длинный пробел) слово

(я скопировал этот код из одного видео в свой собственный проект. Я не знаю, как он работает. Поэтому, пожалуйста, предложите мне внести изменения, учитывая, что я ничего не знаю.)

string strText = string.Empty;
PdfReader reader = new PdfReader(path + dlg.FileName);
            for (int page = 1; page <= reader.NumberOfPages; page++)
            {
                ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.LocationTextExtractionStrategy();
                String s = PdfTextExtractor.GetTextFromPage(reader, page, its);

                s = System.Text.Encoding.UTF8.GetString(System.Text.ASCIIEncoding.Convert(System.Text.Encoding.Default, System.Text.Encoding.UTF8, System.Text.Encoding.Default.GetBytes(s)));
                strText = strText + s;
                txtPdf.Text = strText;
            }
            reader.Close();

1 Ответ

2 голосов
/ 03 мая 2020

Вы можете заменить пробелы в строке, используя Заменить .

Вот пример для вашего случая:

...
s = System.Text.Encoding.UTF8.GetString(System.Text.ASCIIEncoding.Convert(System.Text.Encoding.Default, System.Text.Encoding.UTF8, System.Text.Encoding.Default.GetBytes(s)));
strText = (strText + s).Replace(" ", string.Empty);
txtPdf.Text = strText;
...

Также проверьте документы чтобы начать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...