Корейская кодировка Python `UnicodeEncodeError: кодек 'euc_kr' не может кодировать символ '\ ufeff' в позиции 172: недопустимая многобайтовая последовательность` - PullRequest
0 голосов
/ 16 мая 2019

Я пытаюсь сохранить DataFrame Pandas, который содержит текст на корейском языке, в файл CSV. Я попытался использовать кодировку UTF-8, которая не работала, поэтому я попытался использовать кодеки корейской кодировки, найденные в Интернете. В частности, это будет

pd.to_csv(encoding='korean')

, которое выдает следующее сообщение об ошибке:

UnicodeEncodeError: 'euc_kr' codec can't encode character '\u1100' in position 10: illegal multibyte sequence

Однако я изо всех сил пытаюсь найти позицию 10 и также не могу найти персонажа '\u1100'. Независимо от того, кто-нибудь случайно узнает, в чем может быть проблема?

Я ознакомился с документацией к стандартным кодировкам Python , которая предлагает различные рабочие и не рабочие опции. Те, которые предположительно работают на корейском, также выдают ту же ошибку.

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...