Как я могу прочитать текст на китайском языке из PDF-файла, используя пример "podofotxtextract" (C ++) PoDoFo - PullRequest
0 голосов
/ 23 сентября 2011

Я использую библиотеку PoDoFo 0.9.1 для чтения файла PDF, который содержит китайские символы на ОС Win32 XP для китайской версии.Я обнаружил, что пример проекта PoDoFo «podofotxtextract» может изящно читать PDF на английском, однако, когда я открыл китайский PDF-файл, ничего не разобралось.у кого-нибудь есть предложения?Большое спасибо.

1 Ответ

1 голос
/ 29 декабря 2011

Я использую Objective C, чтобы добавить аннотацию к существующему файлу PDF.
Кстати: просто попробуйте

PdfString pdfString (reinterpret_cast("символы, которые вы читаете ..."));

это код ниже ...

PdfPage* pPage = doc->GetPage(pageIndex);
if (! pPage) {
    // couldn't get that page 
    return;
}
PdfAnnotation* anno;

anno = pPage->CreateAnnotation(ePdfAnnotation_Text, rect);

PdfString sTitle(reinterpret_cast<const pdf_utf8*>([@"中国" UTF8String]));
PdfString sContent(reinterpret_cast<const pdf_utf8*>([@"这是一个中文测试"UTF8String]));
// to parse this annotation
// anno->GetContents().GetStringUtf8().c_str()
anno->SetTitle(sTitle);
anno->SetContents(sContent);
anno->SetOpen(bOpen); 
...