Как преобразовать арабскую кодировку windows-1256, чтобы она стала читабельной в Python 3 с помощью Mac? - PullRequest
0 голосов
/ 20 июня 2019

Я скопировал данные с арабского веб-сайта, похоже, что это так. Я полагаю, это кодировка "windows-1256". Я хочу видеть файл арабскими буквами, например так: بِسْم الله الرحمن الرحيم

Я пробовал несколько вещей, чтобы открыть свой CSV в пандах, например, я использовал кодировку cp1256. Однако, когда я делаю это, я получаю персонажей, которые выглядят так: ‡ أ ، أ ، أ ¥ أ ‡ أ ، أ‘أچأ £ أ¤ أ ‡ أ ، أ‘أچأ

data = pd.read_csv("online_content-articles.csv", sep='\t', header=None, encoding="cp1256")

Я также пытался с кодировками cp864 и iso8859_6, однако я получаю это сообщение: "кодек charmap" не может декодировать байт 0xa3 в позиции 1: символ отображается на "

...