Question

Есть ли способ преобразовать строку из заглавных букв или даже заглавные буквы в строчные?

Например, «Километры» → «Километры».

Petar Ivanov · Answer 1 · 23 июля 2011

Использование .lower() - Например:

s = "Kilometer"
print(s.lower())

Официальная документация 2.x находится здесь: str.lower()
Официальная документация 3.x находится здесь:str.lower()

Vladimir Gorovoy · Answer 2 · 03 октября 2014

В Python 2 это не работает для неанглийских слов в UTF-8. В этом случае decode('utf-8') может помочь:

>>> s='Километр'
>>> print s.lower()
Километр
>>> print s.decode('utf-8').lower()
километр

Aaron Hall · Answer 3 · 24 июля 2015

Как преобразовать строку в нижний регистр в Python?

Есть ли способ преобразовать всю введенную пользователем строку из верхнего или даже прописного в часть в нижний регистр?

Например, Километры -> километры

Канонический Pythonic способ сделать это

>>> 'Kilometers'.lower()
'kilometers'

Однако, если цель состоит в том, чтобы сделать сравнение без учета регистра,вы должны использовать case-fold:

>>> 'Kilometers'.casefold()
'kilometers'

И вот почему:

>>> "Maße".casefold()
'masse'
>>> "Maße".lower()
'maße'
>>> "MASSE" == "Maße"
False
>>> "MASSE".lower() == "Maße".lower()
False
>>> "MASSE".casefold() == "Maße".casefold()
True

Это метод str в Python 3, но в Python 2 вы захотите взглянуть наPyICU или py2casefold - здесь можно найти несколько ответов .

Unicode Python 3

Python 3 обрабатывает обычные строковые литералы как Unicode:

>>> string = 'Километр'
>>> string
'Километр'
>>> string.lower()
'километр'

Python 2, обычные строковые литералы являются байтами

В Python 2 нижеследующее, вставленное в оболочку, кодирует литерал как строку байтов, используя utf-8.

И lower не отображает никаких изменений, о которых будут знать байты, поэтому мы получаем ту же строку.

>>> string = 'Километр'
>>> string
'\xd0\x9a\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> string.lower()
'\xd0\x9a\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> print string.lower()
Километр

В сценариях Python будет возражать против того, чтобы не-ascii (начиная с Python 2.5 и предупреждение в Python 2.4) находились в строке без заданной кодировки, поскольку предполагаемое кодирование будет неоднозначным.Подробнее об этом см. Инструкции по Unicode в документах и PEP 263

Использование литералов Unicode, а не `str` литерал

Таким образом, нам нужна строка unicode для обработки этого преобразования, которая легко выполняется с помощью строкового литерала Unicode, который устраняет неоднозначность с префиксом u (и обратите внимание, что префикс u также работает в Python 3):

>>> unicode_literal = u'Километр'
>>> print(unicode_literal.lower())
километр

Обратите внимание, что байты полностью отличаются от str байтов - escape-символ - '\u', за которым следует 2-байтовая ширина или 16-битное представление этих unicode букв:

>>> unicode_literal
u'\u041a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'
>>> unicode_literal.lower()
u'\u043a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'

Теперь, если у нас есть только форма str, нам нужно преобразовать ее в unicode.Unicode-тип Python - это универсальный формат кодирования, который имеет множество преимуществ по сравнению с большинством других кодировок.Мы можем использовать конструктор unicode или метод str.decode с кодеком для преобразования str в unicode:

>>> unicode_from_string = unicode(string, 'utf-8') # "encoding" unicode from string
>>> print(unicode_from_string.lower())
километр
>>> string_to_unicode = string.decode('utf-8') 
>>> print(string_to_unicode.lower())
километр
>>> unicode_from_string == string_to_unicode == unicode_literal
True

Оба метода преобразуются в тип Unicode - и такой же, как unicode_literal.

Наилучшая практика, используйте Unicode

Рекомендуется, чтобы вы всегда работали с текстом в Unicode .

Программное обеспечение должно работать только сВнутренние строки Unicode, преобразуемые в определенную кодировку при выводе.

Может при необходимости кодировать обратно

Однако, чтобы вернуть строчные буквы в типе str, закодируйте строку python вutf-8 еще раз:

>>> print string
Километр
>>> string
'\xd0\x9a\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> string.decode('utf-8')
u'\u041a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'
>>> string.decode('utf-8').lower()
u'\u043a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'
>>> string.decode('utf-8').lower().encode('utf-8')
'\xd0\xba\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> print string.decode('utf-8').lower().encode('utf-8')
километр

Таким образом, в Python 2 Unicode может кодировать в строки Python, а строки Python могут декодироваться в тип Unicode.

ergo · Answer 4 · 18 ноября 2013

Кроме того, вы можете перезаписать некоторые переменные:

s = input('UPPER CASE')
lower = s.lower()

Если вы используете так:

s = "Kilometer"
print(s.lower())     - kilometer
print(s)             - Kilometer

Это будет работать только при вызове.

U9-Forward · Answer 5 · 07 ноября 2018

Не пытайтесь делать это, абсолютно не рекомендуется, не делайте этого:

import string
s='ABCD'
print(''.join([string.ascii_lowercase[string.ascii_uppercase.index(i)] for i in s]))

Выход:

abcd

Поскольку никто еще не написал его, вы можете использовать swapcase (чтобы заглавные буквы стали строчными, и наоборот) (и эту следует использовать в тех случаях, когда я только что упомянул (преобразовать верхний в нижний, нижний в верхний) ):

s='ABCD'
print(s.swapcase())

Выход:

abcd

Как мне прописать строку в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как преобразовать строку в нижний регистр в Python?

Unicode Python 3

Python 2, обычные строковые литералы являются байтами

Использование литералов Unicode, а не `str` литерал

Наилучшая практика, используйте Unicode

Может при необходимости кодировать обратно

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как мне прописать строку в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как преобразовать строку в нижний регистр в Python?

Unicode Python 3

Python 2, обычные строковые литералы являются байтами

Использование литералов Unicode, а не str литерал

Наилучшая практика, используйте Unicode

Может при необходимости кодировать обратно

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы

Использование литералов Unicode, а не `str` литерал