Question

У меня есть некоторый код Python, который пробегает список строк и преобразует их в целые числа или числа с плавающей запятой, если это возможно. Сделать это для целых чисел довольно просто

if element.isdigit():
  newelement = int(element)

Числа с плавающей точкой сложнее. Сейчас я использую partition('.') для разделения строки и проверяю, чтобы одна или обе стороны были цифрами.

partition = element.partition('.')
if (partition[0].isdigit() and partition[1] == '.' and partition[2].isdigit()) 
    or (partition[0] == '' and partition[1] == '.' and partition[2].isdigit()) 
    or (partition[0].isdigit() and partition[1] == '.' and partition[2] == ''):
  newelement = float(element)

Это работает, но, очевидно, выражение if для этого является чем-то вроде медведя. Другое решение, которое я рассмотрел, - просто обернуть преобразование в блок try / catch и посмотреть, успешно ли оно выполнено, как описано в этот вопрос .

У кого-нибудь есть еще идеи? Мнения об относительных достоинствах раздела и подходах try / catch?

dbr · Answer 1 · 10 апреля 2009

Я бы просто использовал ..

try:
    float(element)
except ValueError:
    print "Not a float"

.. это просто и работает

Другой вариант - регулярное выражение:

import re
if re.match("^\d+?\.\d+?$", element) is None:
    print "Not float"

Eric Leschinski · Answer 2 · 05 января 2014

Метод Python для проверки с плавающей точкой:

def isfloat(value):
  try:
    float(value)
    return True
  except ValueError:
    return False

Не попадайся на гоблинов, которые прячутся в лодке! ПРОВЕРИТЬ ЕДИНИЦУ!

То, что является, а не является поплавком, может вас удивить:

Command to parse                        Is it a float?  Comment
--------------------------------------  --------------- ------------
print(isfloat(""))                      False
print(isfloat("1234567"))               True 
print(isfloat("NaN"))                   True            nan is also float
print(isfloat("NaNananana BATMAN"))     False
print(isfloat("123.456"))               True
print(isfloat("123.E4"))                True
print(isfloat(".1"))                    True
print(isfloat("1,234"))                 False
print(isfloat("NULL"))                  False           case insensitive
print(isfloat(",1"))                    False           
print(isfloat("123.EE4"))               False           
print(isfloat("6.523537535629999e-07")) True
print(isfloat("6e777777"))              True            This is same as Inf
print(isfloat("-iNF"))                  True
print(isfloat("1.797693e+308"))         True
print(isfloat("infinity"))              True
print(isfloat("infinity and BEYOND"))   False
print(isfloat("12.34.56"))              False           Two dots not allowed.
print(isfloat("#56"))                   False
print(isfloat("56%"))                   False
print(isfloat("0E0"))                   True
print(isfloat("x86E0"))                 False
print(isfloat("86-5"))                  False
print(isfloat("True"))                  False           Boolean is not a float.   
print(isfloat(True))                    True            Boolean is a float
print(isfloat("+1e1^5"))                False
print(isfloat("+1e1"))                  True
print(isfloat("+1e1.3"))                False
print(isfloat("+1.3P1"))                False
print(isfloat("-+1"))                   False
print(isfloat("(1)"))                   False           brackets not interpreted

TulasiReddy · Answer 3 · 12 июля 2016

'1.43'.replace('.','',1).isdigit()

, который вернет true, только если есть один или нет '.' в строке цифр.

'1.4.3'.replace('.','',1).isdigit()

вернется false

'1.ww'.replace('.','',1).isdigit()

вернет false

SethMMorton · Answer 4 · 14 августа 2014

TL; DR

Если ваши входные данные в основном представляют собой строки, которые можно преобразовать в числа с плавающей запятой, метод try: except: - лучший нативный метод Python.
Если в качестве входных данных в основном используются строки, которые не могут быть преобразованы в числа с плавающей точкой, регулярные выражения или метод разбиения будут лучше.
Если вы 1) не уверены в своих данных или нуждаетесь в большей скорости и 2) не возражаете и можете установить стороннее C-расширение, fastnumbers работает очень хорошо.

Существует другой метод, доступный через сторонний модуль, который называется fastnumbers (раскрытие, я автор); он предоставляет функцию с именем isfloat . Я взял пример unittest, изложенный Джейкобом Габриэльсоном в этом ответе , но добавил метод fastnumbers.isfloat. Я также должен отметить, что пример Джейкоба не отдает должное опции regex, потому что большую часть времени в этом примере было потрачено на глобальный поиск из-за оператора точки ... Я изменил эту функцию, чтобы дать более справедливое сравнение с try: except: ,

def is_float_try(str):
    try:
        float(str)
        return True
    except ValueError:
        return False

import re
_float_regexp = re.compile(r"^[-+]?(?:\b[0-9]+(?:\.[0-9]*)?|\.[0-9]+\b)(?:[eE][-+]?[0-9]+\b)?$").match
def is_float_re(str):
    return True if _float_regexp(str) else False

def is_float_partition(element):
    partition=element.partition('.')
    if (partition[0].isdigit() and partition[1]=='.' and partition[2].isdigit()) or (partition[0]=='' and partition[1]=='.' and partition[2].isdigit()) or (partition[0].isdigit() and partition[1]=='.' and partition[2]==''):
        return True
    else:
        return False

from fastnumbers import isfloat


if __name__ == '__main__':
    import unittest
    import timeit

    class ConvertTests(unittest.TestCase):

        def test_re_perf(self):
            print
            print 're sad:', timeit.Timer('ttest.is_float_re("12.2x")', "import ttest").timeit()
            print 're happy:', timeit.Timer('ttest.is_float_re("12.2")', "import ttest").timeit()

        def test_try_perf(self):
            print
            print 'try sad:', timeit.Timer('ttest.is_float_try("12.2x")', "import ttest").timeit()
            print 'try happy:', timeit.Timer('ttest.is_float_try("12.2")', "import ttest").timeit()

        def test_fn_perf(self):
            print
            print 'fn sad:', timeit.Timer('ttest.isfloat("12.2x")', "import ttest").timeit()
            print 'fn happy:', timeit.Timer('ttest.isfloat("12.2")', "import ttest").timeit()


        def test_part_perf(self):
            print
            print 'part sad:', timeit.Timer('ttest.is_float_partition("12.2x")', "import ttest").timeit()
            print 'part happy:', timeit.Timer('ttest.is_float_partition("12.2")', "import ttest").timeit()

    unittest.main()

На моей машине вывод:

fn sad: 0.220988988876
fn happy: 0.212214946747
.
part sad: 1.2219619751
part happy: 0.754667043686
.
re sad: 1.50515985489
re happy: 1.01107215881
.
try sad: 2.40243887901
try happy: 0.425730228424
.
----------------------------------------------------------------------
Ran 4 tests in 7.761s

OK

Как вы можете видеть, регулярное выражение на самом деле не так плохо, как казалось изначально, и если вам действительно нужна скорость, метод fastnumbers довольно хорош.

Jacob Gabrielson · Answer 5 · 10 апреля 2009

Если вы заботились о производительности (а я не советую вам это делать), подход, основанный на попытках, является явным победителем (по сравнению с подходом на основе секций или подходом регулярных выражений), если вы не ожидаете много недопустимых строк, в этом случае он потенциально медленнее (предположительно из-за стоимости обработки исключений).

Опять же, я не предлагаю вам заботиться о производительности, просто даю вам данные на случай, если вы делаете это 10 миллиардов раз в секунду или что-то в этом роде. Кроме того, код на основе разделов не обрабатывает хотя бы одну допустимую строку.

$ ./floatstr.py
F..
partition sad: 3.1102449894
partition happy: 2.09208488464
..
re sad: 7.76906108856
re happy: 7.09421992302
..
try sad: 12.1525540352
try happy: 1.44165301323
.
======================================================================
FAIL: test_partition (__main__.ConvertTests)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "./floatstr.py", line 48, in test_partition
    self.failUnless(is_float_partition("20e2"))
AssertionError

----------------------------------------------------------------------
Ran 8 tests in 33.670s

FAILED (failures=1)

Вот код (Python 2.6, регулярное выражение взято из ответа Джона Гитцена ):

def is_float_try(str):
    try:
        float(str)
        return True
    except ValueError:
        return False

import re
_float_regexp = re.compile(r"^[-+]?(?:\b[0-9]+(?:\.[0-9]*)?|\.[0-9]+\b)(?:[eE][-+]?[0-9]+\b)?$")
def is_float_re(str):
    return re.match(_float_regexp, str)


def is_float_partition(element):
    partition=element.partition('.')
    if (partition[0].isdigit() and partition[1]=='.' and partition[2].isdigit()) or (partition[0]=='' and partition[1]=='.' and pa\
rtition[2].isdigit()) or (partition[0].isdigit() and partition[1]=='.' and partition[2]==''):
        return True

if __name__ == '__main__':
    import unittest
    import timeit

    class ConvertTests(unittest.TestCase):
        def test_re(self):
            self.failUnless(is_float_re("20e2"))

        def test_try(self):
            self.failUnless(is_float_try("20e2"))

        def test_re_perf(self):
            print
            print 're sad:', timeit.Timer('floatstr.is_float_re("12.2x")', "import floatstr").timeit()
            print 're happy:', timeit.Timer('floatstr.is_float_re("12.2")', "import floatstr").timeit()

        def test_try_perf(self):
            print
            print 'try sad:', timeit.Timer('floatstr.is_float_try("12.2x")', "import floatstr").timeit()
            print 'try happy:', timeit.Timer('floatstr.is_float_try("12.2")', "import floatstr").timeit()

        def test_partition_perf(self):
            print
            print 'partition sad:', timeit.Timer('floatstr.is_float_partition("12.2x")', "import floatstr").timeit()
            print 'partition happy:', timeit.Timer('floatstr.is_float_partition("12.2")', "import floatstr").timeit()

        def test_partition(self):
            self.failUnless(is_float_partition("20e2"))

        def test_partition2(self):
            self.failUnless(is_float_partition(".2"))

        def test_partition3(self):
            self.failIf(is_float_partition("1234x.2"))

    unittest.main()

Peter Moore · Answer 6 · 23 мая 2018

Просто для разнообразия есть еще один способ сделать это.

>>> all([i.isnumeric() for i in '1.2'.split('.',1)])
True
>>> all([i.isnumeric() for i in '2'.split('.',1)])
True
>>> all([i.isnumeric() for i in '2.f'.split('.',1)])
False

Редактировать: Я уверен, что это не будет соответствовать всем случаям с плавающей точкой, особенно когда есть экспонента. Чтобы решить это выглядит так. Это вернет True, только val является float и False для int, но, вероятно, менее производительно, чем регулярное выражение.

>>> def isfloat(val):
...     return all([ [any([i.isnumeric(), i in ['.','e']]) for i in val],  len(val.split('.')) == 2] )
...
>>> isfloat('1')
False
>>> isfloat('1.2')
True
>>> isfloat('1.2e3')
True
>>> isfloat('12e3')
False

kodetojoy · Answer 7 · 08 октября 2015

Если вам не нужно беспокоиться о научных или других выражениях чисел, и вы работаете только со строками, которые могут быть числами с или без точки:

Функция

def is_float(s):
    result = False
    if s.count(".") == 1:
        if s.replace(".", "").isdigit():
            result = True
    return result

Лямбда-версия

is_float = lambda x: x.replace('.','',1).isdigit() and "." in x

Пример

if is_float(some_string):
    some_string = float(some_string)
elif some_string.isdigit():
    some_string = int(some_string)
else:
    print "Does not convert to int or float."

Таким образом, вы не случайно конвертируете то, что должно быть int, в число с плавающей точкой.

John Gietzen · Answer 8 · 10 апреля 2009

Это регулярное выражение будет проверять научные числа с плавающей точкой:

^[-+]?(?:\b[0-9]+(?:\.[0-9]*)?|\.[0-9]+\b)(?:[eE][-+]?[0-9]+\b)?$

Однако я считаю, что лучше всего использовать парсер в попытке.

edW · Answer 9 · 31 декабря 2018

Попробуйте конвертировать в float. В случае ошибки выведите исключение ValueError.

try:
    x = float('1.23')
    print('val=',x)
    y = float('abc')
    print('val=',y)
except ValueError as err:
    print('floatErr;',err)

Выход:

val= 1.23
floatErr: could not convert string to float: 'abc'

simhumileco · Answer 10 · 15 сентября 2018

Упрощенная версия функции is_digit(str), которая в большинстве случаев достаточна (не учитывает экспоненциальная запись и "NaN" значение):

def is_digit(str):
    return str.lstrip('-').replace('.', '').isdigit()

Проверка возможности преобразования строки в плавающее в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Метод Python для проверки с плавающей точкой:

Не попадайся на гоблинов, которые прячутся в лодке! ПРОВЕРИТЬ ЕДИНИЦУ!

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проверка возможности преобразования строки в плавающее в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Метод Python для проверки с плавающей точкой:

Не попадайся на гоблинов, которые прячутся в лодке! ПРОВЕРИТЬ ЕДИНИЦУ!

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов