Я создал файл PDF с возможностью поиска, выполнив следующую команду для одного из моих изображений.
tesseract page.jpg test pdf --oem 1 --psm 5 -l urd
это изображение, которое я преобразовал в файл PDF с возможностью поиска.![enter image description here](https://i.stack.imgur.com/hItnU.png)
изображение содержит текст на языке урду, но когда я копирую его из вновь созданного файла PDF и вставляю в любой другой текстовый редактор, это то, что я получаю.
GehbFie ”
любой специалист по оптическому распознаванию текста и кодировке, который может решить мою проблему, пожалуйста, любая помощь будет высоко оценена, спасибо заранее.