Как читать метаданные UTF, возвращаемые PDFsharp? - PullRequest
0 голосов
/ 11 октября 2018

Я пытаюсь прочитать некоторые метаданные из файла PDF и для этого использую PDFsharp.К сожалению, кажется, что создатель возвращается как UTF.

var reader = PdfReader.Open("data.pdf");
var creator = reader.Info.Creator; // þÿ\0M\0i\0c\0r\0o\0s\0o\0f\0t\0®\0 \0W\0o\0r\0d\0 \02\00\01\03

При использовании iTextSharp он работает нормально, что показывает, что проблема не в файле.

var reader = new PdfReader("data.pdf");
var creator = reader.Info["Creator"]; // Microsoft® Word 2013

Как правильно прочитать создатель с помощью PDFsharp?Поскольку это, похоже, проблема с кодировкой, у меня сложилось впечатление, что это должно быть относительно легко исправить, но я не могу ее найти.

1 Ответ

0 голосов
/ 12 октября 2018

Я могу повторить это поведение с PDFsharp 1.32 с 2013 года.
Я не могу повторить это поведение с PDFsharp 1.50 с 2018. В последние пять лет эта проблема была исправлена.

Используйтепоследняя версия PDFsharp, и вы можете получить доступ к метаданным, как и ожидалось.Это очень легко исправить.Нет ничего плохого в том, чтобы всегда пробовать последнюю версию в первую очередь при возникновении проблем.

...