Получение количества страниц PDF в C # с использованием статического wkHTMLtoPDF - PullRequest
0 голосов
/ 11 февраля 2012

Я использую следующую оболочку WkHtmlToXSharp для преобразования отчетов HTML в PDF. Я хотел бы также записать количество страниц после завершения конвертации.

Есть ли способ извлечь количество страниц из двоичного PDF в памяти? Или мне нужно использовать дополнительные библиотеки PDF, такие как iTextSharp, чтобы извлечь количество страниц из PDF?

Использование Javascript в нижнем колонтитуле / странице не является приемлемым решением, так как это может быть отчет объемом 60-80 страниц.

Спасибо, Рафи

1 Ответ

0 голосов
/ 18 сентября 2012

Если вы генерируете PDF самостоятельно, вы можете попробовать подсчитать их напрямую из исходного формата PDF. Для этого есть учебники, например, в http://www.codeproject.com/Articles/14768/Counting-PDF-Pages-using-Regular-Expressions

Я не буду повторять их здесь, но идея состоит в том, чтобы подсчитать, сколько /Type /Page обращений в PDF есть с помощью регулярных выражений. Откройте сгенерированный PDF в хорошем текстовом редакторе, и вы увидите их сами. Не упустите один «/ Type / Pages», который сбрасывает число на единицу, найти хорошее регулярное выражение легко, когда вы «управляете» генерацией PDF или, по крайней мере, знаете, что оно соответствует.

...