Как читать все страницы из PDF? - PullRequest
0 голосов
/ 03 августа 2011

Я использую SDK от pdftron, который читает по одной странице за раз. Мой код будет:

PDFDoc doc = new PDFDoc(input_path);
doc.InitSecurityHandler();
PageIterator itr = doc.GetPage(1);

for (line = txt.GetFirstLine(); line.IsValid(); line = line.GetNextLine()){
  for (word = line.GetFirstWord(); word.IsValid(); word = word.GetNextWord()){
    Console.WriteLine(word.GetString());
  }
}

Я хочу прочитать каждую страницу, я опубликовал свою проблему на форумах PDFTRON. Но не смог найти решение для этого. Можно ли читать все страницы?

1 Ответ

1 голос
/ 03 августа 2011

Да, вы можете читать каждую страницу pdf за раз. Вам нужно просто сделать небольшое изменение инициализации страницы итератора. Я изменил код, и он отлично работает.

    PDFDoc doc = new PDFDoc(input_path);
    doc.InitSecurityHandler();
     PageIterator itr = doc.GetPageIterator();
     for (; itr.HasNext(); itr.Next()) //  Read every page
    {
    for (line = txt.GetFirstLine(); line.IsValid(); line = line.GetNextLine())
    {
    for (word = line.GetFirstWord(); word.IsValid(); word = word.GetNextWord())
    {
    Console.WriteLine(word.GetString());
    }
    }
    }

Надеюсь, это поможет вам.

...