Неподдерживаемые символы при вводе - PullRequest
5 голосов
/ 02 февраля 2011

Я хочу присвоить строку символов переменной, но там написано

: there isn't a "code to show.

У меня есть строка, которую я хочу присвоить переменной

d="stunning:/ËstÊnɪÅ/"
Unsupported characters in input

или

word="stuning:/ˈstraɪkɪŋ/"
Unsupported characters in input

так что в основном интерпретатор не позволяет мне присвоить его переменной, поэтому я не могу кодировать его.

Как я могу извлечь, удалить эти символы из текста, или есть что-то сделать, чтобы Python поддерживал этот тип ввода.

Я пытался преобразовать его в другие форматы, такие как ansi, utf и т. Д., Но безуспешно.

П.С .: Я использую Python 2.7

Ответы [ 2 ]

8 голосов
/ 02 февраля 2011

Установите кодировку исходного файла в соответствии с фактической кодировкой файла, чтобы интерпретатор знал, как его анализировать.

Например, если вы используете UTF-8, просто добавьте эту строку в заголовокфайла:

    # -*- coding: utf8 -*-

Это должна быть первая или вторая строка файла.См. PEP 0263: определение кодировок исходного кода Python .

2 голосов
/ 02 февраля 2011

Просто подсказка (ожидание реального кода): добавьте u к строке, чтобы пометить ее как Unicode.

u"/ËstraɪkɪÅ/"
...