Согласно документации:
В приведенном ниже примере обратите внимание, что CID 7 относится к разным формам в CIDFonts, но всегда означает «амперсанд». Аналогично, CID 112 относится к другому классу форм. , но всегда означает «фи лигатура».
https://www.adobe.com/content/dam/acom/en/devnet/font/pdfs/5014.CIDFont_Spec.pdf стр. 14
Как я могу получить общий код CID для сопоставления с реальным символом? что-то вроде этого:
CID Utf-8
7 &
112 и
...