В прошлом, когда мне требовались массивные индексные поиски в узком цикле, я обычно использовал кортежи, поскольку они, как правило, чрезвычайно производительны (близки к использованию только n-го числа переменных). Однако сегодня я решил поставить под сомнение это предположение и получил неожиданные результаты:
In [102]: l = range(1000)
In [103]: t = tuple(range(1000))
In [107]: timeit(lambda : l[500], number = 10000000)
Out[107]: 2.465047836303711
In [108]: timeit(lambda : t[500], number = 10000000)
Out[108]: 2.8896381855010986
Поиски в кортежах занимают на 17% больше времени, чем в списках! Повторные эксперименты дали аналогичные результаты. Разбирая каждый, я обнаружил, что они оба:
In [101]: dis.dis(lambda : l[5])
1 0 LOAD_GLOBAL 0 (l)
3 LOAD_CONST 1 (5)
6 BINARY_SUBSCR
7 RETURN_VALUE
Для справки, типичный поиск / возврат глобальной переменной в 10 000 000 занимает 2,2 с. Кроме того, я запустил его без лямбд, знаете, на всякий случай (обратите внимание, что число = 100 000 000, а не 10 000 000).
In [126]: timeit('t[500]', 't=range(1000)', number=100000000)
Out[126]: 6.972800970077515
In [127]: timeit('t[500]', 't=tuple(range(1000))', number=100000000)
Out[127]: 9.411366939544678
Здесь поиск кортежей занимает на 35% больше времени. Что тут происходит? Для очень плотных петель это на самом деле кажется существенным расхождением. Что может быть причиной этого?
Обратите внимание, что для разложения на переменные (например, x, y = t) кортежи немного быстрее (~ 6% в моих нескольких тестах меньше времени), а для построения из фиксированного числа аргументов кортежи быстрее сумасшедшие (~ 83 % меньше времени). Не принимайте эти результаты как общие правила; Я только что выполнил несколько мини-концертов, которые будут бессмысленными для большинства проектов.
In [169]: print(sys.version)
2.7.1 (r271:86882M, Nov 30 2010, 09:39:13)
[GCC 4.0.1 (Apple Inc. build 5494)]