Безопасный разбор целочисленных значений в Ruby - PullRequest
152 голосов
/ 08 сентября 2008

У меня есть строка, скажем '123', и я хочу преобразовать ее в 123.

Я знаю, что вы можете просто сделать some_string.to_i, но это преобразует 'lolipops' в 0, что не является эффектом, который я имею в виду. Я хочу, чтобы это взорвалось мне в лицо, когда я пытаюсь преобразовать что-то недействительное, с хорошим и болезненным Exception. В противном случае, я не могу отличить действительный 0 от чего-то, что просто не является числом.

РЕДАКТИРОВАТЬ: Я искал стандартный способ сделать это, без обмана регулярных выражений.

Ответы [ 8 ]

222 голосов
/ 08 сентября 2008

В Ruby встроена эта функциональность:

Integer('1001')                                    # => 1001  
Integer('1001 nights')  
# ArgumentError: invalid value for Integer: "1001 nights"  

Как отмечено в ответе Джозефом Пекораро , вы можете захотеть следить за строками, которые являются действительными недесятичными числами, такими как строки, начинающиеся с 0x для шестнадцатеричного числа и 0b для двоичного, и потенциально более сложные числа, начинающиеся с нуля, которые будут проанализированы как восьмеричные.

В Ruby 1.9.2 добавлен необязательный второй аргумент для radix, поэтому вышеупомянутой проблемы можно избежать:

Integer('23')                                     # => 23
Integer('0x23')                                   # => 35
Integer('023')                                    # => 19
Integer('0x23', 10)
# => #<ArgumentError: invalid value for Integer: "0x23">
Integer('023', 10)                                # => 23
27 голосов
/ 08 сентября 2008

Это может сработать:

i.to_i if i.match(/^\d+$/)
24 голосов
/ 10 сентября 2008

Также следует учитывать влияние, которое текущее принятое решение может оказать на синтаксический анализ шестнадцатеричных, восьмеричных и двоичных чисел:

>> Integer('0x15')
# => 21  
>> Integer('0b10')
# => 2  
>> Integer('077')
# => 63

В Ruby числа, начинающиеся с 0x или 0X, являются шестнадцатеричными, 0b или 0B - двоичными, а просто 0 - восьмеричными. Если это нежелательное поведение, вы можете объединить это с некоторыми другими решениями, которые проверяют, соответствует ли строка шаблону. Как регулярные выражения /\d+/ и т. Д.

14 голосов
/ 31 марта 2010

Другое неожиданное поведение с принятым решением (с 1.8, 1.9 в порядке):

>> Integer(:foobar)
=> 26017
>> Integer(:yikes)
=> 26025

поэтому, если вы не уверены, что именно передается, обязательно добавьте .to_s.

9 голосов
/ 13 мая 2013

Мне нравится ответ Мирона, но он страдает от болезни Руби «Я больше не использую Java / C #, поэтому никогда не буду использовать наследование снова» . Открытие любого класса может быть чревато опасностью и должно использоваться с осторожностью, особенно , когда он является частью базовой библиотеки Ruby. Я не говорю, никогда не используйте его, но обычно его легко избежать, и что есть лучшие варианты, например,

class IntegerInString < String

  def initialize( s )
    fail ArgumentError, "The string '#{s}' is not an integer in a string, it's just a string." unless s =~ /^\-?[0-9]+$/
    super
  end
end

Тогда, когда вы захотите использовать строку, которая может быть числом, вам станет ясно, что вы делаете, и вы не заглушите какой-либо основной класс, например,

n = IntegerInString.new "2"
n.to_i
# => 2

IntegerInString.new "blob"
ArgumentError: The string 'blob' is not an integer in a string, it's just a string.

Вы можете добавить всевозможные другие проверки в инициализацию, например, проверку двоичных чисел и т. Д. Главное, чтобы Ruby был для людей, а для людей означает ясность . Присвоение имени объекту через имя переменной и его имя класса делают вещи намного более понятными.

6 голосов
/ 25 сентября 2008

Мне приходилось сталкиваться с этим в моем последнем проекте, и моя реализация была похожей, но немного другой:

class NotAnIntError < StandardError 
end

class String
  def is_int?    
    self =~ /^-?[0-9]+$/
  end

  def safe_to_i
    return self.to_i if is_int?
    raise NotAnIntError, "The string '#{self}' is not a valid integer.", caller
  end
end

class Integer
  def safe_to_i
    return self
  end            
end

class StringExtensions < Test::Unit::TestCase

  def test_is_int
    assert "98234".is_int?
    assert "-2342".is_int?
    assert "02342".is_int?
    assert !"+342".is_int?
    assert !"3-42".is_int?
    assert !"342.234".is_int?
    assert !"a342".is_int?
    assert !"342a".is_int?
  end

  def test_safe_to_i
    assert 234234 == 234234.safe_to_i
    assert 237 == "237".safe_to_i
    begin
      "a word".safe_to_i
      fail 'safe_to_i did not raise the expected error.'
    rescue NotAnIntError 
      # this is what we expect..
    end
  end

end
2 голосов
/ 08 сентября 2008
someString = "asdfasd123"
number = someString.to_i
if someString != number.to_s
  puts "oops, this isn't a number"
end

Вероятно, не самый чистый способ сделать это, но должен работать.

1 голос
/ 10 сентября 2008

Re: Крис ответил

Ваша реализация позволяет вещам вроде "1a" или "b2" пройти. Как насчет этого вместо:

def safeParse2(strToParse)
  if strToParse =~ /\A\d+\Z/
    strToParse.to_i
  else
    raise Exception
  end
end

["100", "1a", "b2", "t"].each do |number|
  begin
    puts safeParse2(number)
  rescue Exception
    puts "#{number} is invalid"
  end
end

Это выводит:

100
1a is invalid
b2 is invalid
t is invalid
...