Я работаю с poppler на C ++, и у меня есть несколько PDF-файлов, которые содержат штрих-коды.
Большинство PDF-принтеров, с которыми мне приходится работать, печатают PDF и его номера отдельно, поэтому мне не приходится считывать штрих-код. Но те, которые выражают штрих-код и его номер одним символом, вызывают у меня странные символы, которые я не знаю, как перевести.
Например, есть документ со следующим штрих-кодом.
3065894901901000368529198928291201901066
Но если я копирую его, я получаю это (я получаю тот же результат с pdftotext Попплера)
(NÏça1è: 0TãMCçLM <1е: Ð) </p>
Есть ли способ перевести эти странные символы обратно в числа, которыми они должны быть?