У нас есть сотни PDF на "грузинском" языке.Мы извлекли и сохранили таблицы из этих PDF-файлов как csv (используя Camelot Python Table Extraction library).Но в целом они на другом языке.
Я проверил шрифты, встроенные в pdf, используя xpdf
Я пытаюсь перевести эти csv с грузинского на английский, используя "googletrans".Но не знаю, как поступить с « кодировкой ».Нужно ли сохранять (кодировать) все CSV-файлы в другом формате?