Я использовал iTextSharp для чтения PDF-файла. Я могу читать английский текст, но для китайского я получаю знаки вопроса, как я могу читать китайские иероглифы, используя iTextSharp.
coverNoteFilePath = @"D:\Temp\cc8a12e6-399a-4146-81ac-e49eb67e7e1b\CoverNote.pdf";
try
{
PdfReader reader = new PdfReader(coverNoteFilePath);
for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
String s = PdfTextExtractor.GetTextFromPage(reader, page, its);
s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
coverNoteContent = coverNoteContent + s;
}
reader.Close();
Response.Write(coverNoteContent);
}