Я нашел этот вопрос очень интересным, поскольку он предоставляет несколько разных решений для одной и той же проблемы. Я взял все эти функции и проверил их с помощью сложного словарного объекта. Мне пришлось убрать две функции из теста, потому что у них было много неудачных результатов, и они не поддерживали возвращение списков или диктов в качестве значений, что я считаю необходимым, поскольку функция должна быть подготовлена для почти любого данные для поступления.
Таким образом, я прокачал другие функции за 100 000 итераций через модуль timeit
, и на выходе получился следующий результат:
0.11 usec/pass on gen_dict_extract(k,o)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
6.03 usec/pass on find_all_items(k,o)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
0.15 usec/pass on findkeys(k,o)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
1.79 usec/pass on get_recursively(k,o)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
0.14 usec/pass on find(k,o)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
0.36 usec/pass on dict_extract(k,o)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Все функции имели одну и ту же стрелку для поиска ('logging') и один и тот же объект словаря, который построен следующим образом:
o = { 'temparature': '50',
'logging': {
'handlers': {
'console': {
'formatter': 'simple',
'class': 'logging.StreamHandler',
'stream': 'ext://sys.stdout',
'level': 'DEBUG'
}
},
'loggers': {
'simpleExample': {
'handlers': ['console'],
'propagate': 'no',
'level': 'INFO'
},
'root': {
'handlers': ['console'],
'level': 'DEBUG'
}
},
'version': '1',
'formatters': {
'simple': {
'datefmt': "'%Y-%m-%d %H:%M:%S'",
'format': '%(asctime)s - %(name)s - %(levelname)s - %(message)s'
}
}
},
'treatment': {'second': 5, 'last': 4, 'first': 4},
'treatment_plan': [[4, 5, 4], [4, 5, 4], [5, 5, 5]]
}
Все функции дали одинаковый результат, но разница во времени впечатляет! Функция gen_dict_extract(k,o)
- это моя функция, адаптированная из этих функций, на самом деле она во многом похожа на функцию find
от Alfe, с основным отличием в том, что я проверяю, есть ли у данного объекта функция iteritems, если передаются строки во время рекурсии:
def gen_dict_extract(key, var):
if hasattr(var,'iteritems'):
for k, v in var.iteritems():
if k == key:
yield v
if isinstance(v, dict):
for result in gen_dict_extract(key, v):
yield result
elif isinstance(v, list):
for d in v:
for result in gen_dict_extract(key, d):
yield result
Так что этот вариант самый быстрый и безопасный из функций здесь. И find_all_items
невероятно медленный и далеко от второго самого медленного get_recursivley
, в то время как остальные, кроме dict_extract
, находятся близко друг к другу. Функции fun
и keyHole
работают, только если вы ищете строки.
Интересный аспект обучения здесь:)