Сравнение строки в Python: строка X является ASCII, а строка Y - UTF - PullRequest
2 голосов
/ 03 апреля 2011

У меня довольно странная проблема: как сравнить строки (используя Python) с тем, где String X - это ASCII, а String Y - в UTF или Unicode?

В настоящее время при сравнении строк я получаюследующая проблема:

UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal
  filteredtext = [t for t in s if t.lower() not in stopwords]

Как мне убедиться, что строки имеют одинаковый формат?

С наилучшими пожеланиями.

1 Ответ

6 голосов
/ 03 апреля 2011

Преобразуйте все строки, используя нижележащую кодировку, и сравните их:

print unicode(s1, 'ascii') == unicode(s1, 'utf-8')
...