Как искать конкретные токены Unicode в списке в Python - PullRequest
0 голосов
/ 24 мая 2018

Я хочу найти конкретную строку из файла, для которого код выглядит следующим образом

f1= codecs.open('brokenhindi.txt', encoding='utf-8')
for tokens in f1:
    if u"राज्य" in tokens:
        print 'done_3'

, но он не выполнил поиск строки (राज्य), если я заменил राज्य на английский токен, то онищет это.Я не могу найти ошибку в коде.

1 Ответ

0 голосов
/ 24 мая 2018

Ваш код просто отлично работает.Тем не менее, кажется, что ваш скрипт или ваш текстовый файл в кодировке ascii, а не в utf-8.Попробуйте сохранить его в кодировке utf-8

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...