Question

У нас есть сотни PDF на "грузинском" языке.Мы извлекли и сохранили таблицы из этих PDF-файлов как csv (используя Camelot Python Table Extraction library).Но в целом они на другом языке.

Я проверил шрифты, встроенные в pdf, используя xpdf

Я пытаюсь перевести эти csv с грузинского на английский, используя "googletrans".Но не знаю, как поступить с « кодировкой ».Нужно ли сохранять (кодировать) все CSV-файлы в другом формате?

Как декодировать pdf тексты на грузинском языке в csvs с помощью соответствующего метода декодирования?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как декодировать pdf тексты на грузинском языке в csvs с помощью соответствующего метода декодирования?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы