Powershell не может печатать символы девнагри - PullRequest
0 голосов
/ 23 января 2019

При попытке реализовать коды, приведенные в качестве примеров в книге для NLTK на python, работающем непосредственно в PowerShell, некоторые символы не печатаются.Версия Python - 3.6.0, и, следовательно, кодировка UTF-8 по мере необходимости.Проблема в том, что вывод командной строки текста, закодированного в UTF-8, не отображается из-за, вероятно, другой кодировки консоли.

Мне кажется, я видел один пост, похожий на этот, который спрашивал о русских буквах, ноэто было специфично для Java и Linux.Это дало мне возможность искать настройки кодирования консоли и менять ее на UTF-8.Но я не могу найти эти настройки.

>>> import nltk
>>> nltk.download('cess_esp')
>>> nltk.corpus.cess_esp.words()
['El', 'grupo', 'estatal', 'Electricité_de_France', ...]
>>> nltk.download('indian')
>>> nltk.corpus.indian.words()
['মহিষের', 'সন্তান', ':', 'তোড়া', 'উপজাতি', '৷', ...]

Как показано в коде, я пытаюсь распечатать два вида слов: испанский и индийский (девнагри).Но только вывод для испанского языка распечатывается правильно, а для индийского вместо букв отображаются пустые квадраты / квадраты.Однако, когда я копирую и вставляю «выходные данные пустых ящиков» для индейца в адресной строке Chrome или, например, в этом сообщении, он выводит его правильно.

Редактировать: предлагаемый возможный дублирующий запрос ( Отображение Unicode в Powershell ) решает ту же проблему, за исключением того, что он предлагает шрифт, который будет работать для арабских, китайских, японских и русских символов.Я попробовал этот шрифт и в моем случае, чувствуя себя немного везучим.К сожалению, это не сработало!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...