Почему в стандартной библиотеке нет реализации с плавающей запятой?
Как ясно из всех сообщений здесь, нет версии с плавающей запятой range()
. Тем не менее, упущение имеет смысл, если учесть, что функция range()
часто используется в качестве индекса (и, конечно, это означает генератор accessor ). Итак, когда мы вызываем range(0,40)
, мы фактически говорим, что хотим 40 значений, начиная с 0, до 40, но не включая сами 40.
Когда мы считаем, что генерация индексов зависит как от количества индексов, так и от их значений, использование реализации с плавающей запятой range()
в стандартной библиотеке имеет меньше смысла. Например, если бы мы вызвали функцию frange(0, 10, 0.25)
, мы ожидали бы, что будут включены и 0, и 10, но это приведет к вектору с 41 значением.
Таким образом, функция frange()
в зависимости от ее использования всегда будет демонстрировать противоречивое интуитивное поведение; он либо имеет слишком много значений, воспринимаемых с точки зрения индексации, либо не содержит числа, которое разумно следует возвращать с математической точки зрения.
Математический пример использования
С учетом сказанного, как уже говорилось, numpy.linspace()
прекрасно выполняет генерацию с математической точки зрения:
numpy.linspace(0, 10, 41)
array([ 0. , 0.25, 0.5 , 0.75, 1. , 1.25, 1.5 , 1.75,
2. , 2.25, 2.5 , 2.75, 3. , 3.25, 3.5 , 3.75,
4. , 4.25, 4.5 , 4.75, 5. , 5.25, 5.5 , 5.75,
6. , 6.25, 6.5 , 6.75, 7. , 7.25, 7.5 , 7.75,
8. , 8.25, 8.5 , 8.75, 9. , 9.25, 9.5 , 9.75, 10.
])
Вариант использования индексации
И для перспективы индексации я написал немного другой подход с некоторой хитрой магией строк, которая позволяет нам указывать количество десятичных знаков.
# Float range function - string formatting method
def frange_S (start, stop, skip = 1.0, decimals = 2):
for i in range(int(start / skip), int(stop / skip)):
yield float(("%0." + str(decimals) + "f") % (i * skip))
Аналогичным образом, мы также можем использовать встроенную функцию round
и указать количество десятичных знаков:
# Float range function - rounding method
def frange_R (start, stop, skip = 1.0, decimals = 2):
for i in range(int(start / skip), int(stop / skip)):
yield round(i * skip, ndigits = decimals)
Быстрое сравнение и производительность
Конечно, учитывая вышеприведенное обсуждение, эти функции имеют довольно ограниченный вариант использования. Тем не менее, вот быстрое сравнение:
def compare_methods (start, stop, skip):
string_test = frange_S(start, stop, skip)
round_test = frange_R(start, stop, skip)
for s, r in zip(string_test, round_test):
print(s, r)
compare_methods(-2, 10, 1/3)
Результаты идентичны для каждого:
-2.0 -2.0
-1.67 -1.67
-1.33 -1.33
-1.0 -1.0
-0.67 -0.67
-0.33 -0.33
0.0 0.0
...
8.0 8.0
8.33 8.33
8.67 8.67
9.0 9.0
9.33 9.33
9.67 9.67
И немного времени:
>>> import timeit
>>> setup = """
... def frange_s (start, stop, skip = 1.0, decimals = 2):
... for i in range(int(start / skip), int(stop / skip)):
... yield float(("%0." + str(decimals) + "f") % (i * skip))
... def frange_r (start, stop, skip = 1.0, decimals = 2):
... for i in range(int(start / skip), int(stop / skip)):
... yield round(i * skip, ndigits = decimals)
... start, stop, skip = -1, 8, 1/3
... """
>>> min(timeit.Timer('string_test = frange_s(start, stop, skip); [x for x in string_test]', setup=setup).repeat(30, 1000))
0.024284090992296115
>>> min(timeit.Timer('round_test = frange_r(start, stop, skip); [x for x in round_test]', setup=setup).repeat(30, 1000))
0.025324633985292166
Похоже, что метод форматирования строк выигрывает в моей системе.
Ограничения
И, наконец, демонстрация сути из вышеприведенного обсуждения и одно последнее ограничение:
# "Missing" the last value (10.0)
for x in frange_R(0, 10, 0.25):
print(x)
0.25
0.5
0.75
1.0
...
9.0
9.25
9.5
9.75
Кроме того, когда параметр skip
не делится на значение stop
, может возникать зияющая щель с учетом последней проблемы:
# Clearly we know that 10 - 9.43 is equal to 0.57
for x in frange_R(0, 10, 3/7):
print(x)
0.0
0.43
0.86
1.29
...
8.14
8.57
9.0
9.43
Существуют способы решения этой проблемы, но, в конце концов, лучшим подходом, вероятно, будет просто использовать Numpy.