Question

Как удалить все нечисловые символы из строки в Python?

Mark Rushakoff · Answer 1 · 08 августа 2009

Не уверен, что это самый эффективный способ, но:

>>> ''.join(c for c in "abc123def456" if c.isdigit())
'123456'

Часть ''.join означает объединение всех полученных символов без каких-либо символов между ними. Тогда остальное это понимание списка, где (как вы, вероятно, можете догадаться) мы берем только те части строки, которые соответствуют условию isdigit.

tzot · Answer 2 · 07 сентября 2009

Это должно работать для строк и объектов Unicode:

# python <3.0
def only_numerics(seq):
    return filter(type(seq).isdigit, seq)

# python ≥3.0
def only_numerics(seq):
    seq_type= type(seq)
    return seq_type().join(filter(seq_type.isdigit, seq))

Tim McNamara · Answer 3 · 07 сентября 2012

Чтобы добавить еще один параметр в микс, в модуле string есть несколько полезных констант. Хотя они более полезны в других случаях, их можно использовать здесь.

>>> from string import digits
>>> ''.join(c for c in "abc123def456" if c in digits)
'123456'

В модуле есть несколько констант, в том числе:

ascii_letters (abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ)
hexdigits (0123456789abcdefABCDEF)

Если вы интенсивно используете эти константы, может оказаться целесообразным преобразовать их в frozenset. Это позволяет искать O (1), а не O (n), где n - длина константы для исходных строк.

>>> digits = frozenset(digits)
>>> ''.join(c for c in "abc123def456" if c in digits)
'123456'

Alex Martelli · Answer 4 · 08 августа 2009

Самый быстрый подход, если вам нужно выполнить более одной или двух таких операций удаления (или даже только одну, но с очень длинной строкой! -), это полагаться на метод translate строк, даже если для этого нужно подготовиться:

>>> import string
>>> allchars = ''.join(chr(i) for i in xrange(256))
>>> identity = string.maketrans('', '')
>>> nondigits = allchars.translate(identity, string.digits)
>>> s = 'abc123def456'
>>> s.translate(identity, nondigits)
'123456'

Метод translate отличается и, возможно, немного проще в использовании для строк Unicode, чем для байтовых строк, кстати:

>>> unondig = dict.fromkeys(xrange(65536))
>>> for x in string.digits: del unondig[ord(x)]
... 
>>> s = u'abc123def456'
>>> s.translate(unondig)
u'123456'

Возможно, вы захотите использовать класс сопоставления, а не фактический dict, особенно если ваша строка Unicode может потенциально содержать символы с очень высокими значениями ord (что может привести к чрезмерно большому dict ;-). Например:

>>> class keeponly(object):
...   def __init__(self, keep): 
...     self.keep = set(ord(c) for c in keep)
...   def __getitem__(self, key):
...     if key in self.keep:
...       return key
...     return None
... 
>>> s.translate(keeponly(string.digits))
u'123456'
>>>

kennyut · Answer 5 · 09 ноября 2018

@ Нед Бэтчелдер и @newacct дали правильный ответ, но ...

На всякий случай, если в строке есть запятая (,) десятичная (.):

import re
re.sub("[^\d\.]", "", "$1,999,888.77")
'1999888.77'

Удаление всех нечисловых символов из строки в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удаление всех нечисловых символов из строки в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов