Я смотрю на следующий URL: http://www.unisonagency.com/assets/news/unison_pr_mvsl.pdf
Все инструменты извлечения текста с открытым исходным кодом, которые я пробовал, дают мне следующее для заголовка:
uNISON LAuNCHeS MAGHReb VIRTuAL SCIeNCe LIbRARy: A NeW
PORTAL PROMOTING INTeRNATIONAL SCIeNTIFIC AND
TeCHNICAL COLLAbORATION
ОднакоAdobe Acrobat Reader дает что-то более разумное -
Unison Launch es Maghr eb Virt ual Sci enc e
Librar y: A New Portal Promoting Int ernational
Scientific and Technical Colla boration
Пробелы отключены, но регистр символов имеет больше смысла.Есть идеи, почему есть расхождение?