Как декодировать pdf тексты на грузинском языке в csvs с помощью соответствующего метода декодирования? - PullRequest
0 голосов
/ 02 апреля 2019

У нас есть сотни PDF на "грузинском" языке.Мы извлекли и сохранили таблицы из этих PDF-файлов как csv (используя Camelot Python Table Extraction library).Но в целом они на другом языке.

enter image description here

Я проверил шрифты, встроенные в pdf, используя xpdf

enter image description here

Я пытаюсь перевести эти csv с грузинского на английский, используя "googletrans".Но не знаю, как поступить с « кодировкой ».Нужно ли сохранять (кодировать) все CSV-файлы в другом формате?

...