Извлечение нескольких списков атрибутов из списка объектов с несколькими атрибутами в python3 - PullRequest
0 голосов
/ 12 октября 2018

У меня есть класс A с несколькими полями a, b, c.У меня есть список объектов этого класса A.Теперь я хочу извлечь 3 списка, первый из которых содержит значения поля a из всех объектов, второй список содержит значения поля b и третьи значения c.

Я нашел ответы ниже
Этот ответ говорит, что я могу использовать понимание списка, как показано ниже

a_list=[obj.a for obj in obj_list]

Этот ответ говорит, что использовать Выражения генератора для экономии памяти

a_list=(obj.a for obj in obj_list)

Теперь мой вопрос, будет ли это работать, когда я хочу извлечь несколько атрибутов?Если я напишу строку 3 раза, как показано ниже

a_list=(obj.a for obj in obj_list)
b_list=(obj.b for obj in obj_list)
c_list=(obj.c for obj in obj_list)

, я буду повторять список 3 раза.Не будет ли это дорогостоящим?В таком случае лучше использовать цикл?

for obj in obj_list:
    a_list.append(obj.a)
    b_list.append(obj.b)
    c_list.append(obj.c)

Что быстрее?Что является лучшим подходом.Есть ли другой, более оптимизированный способ?Спасибо!

1 Ответ

0 голосов
/ 12 октября 2018

Каждый раз, когда вы думаете, что « X быстрее, чем Y », вам нужно измерить.

Вы можете придумать способ не передавать свой список три раза.

Этот «путь» тогда, возможно, все еще не будет быстрее, хотя из-за того, что он делает весь код более сложным и вычислительно дорогим.zip и карта, например, так:

class O:
    def __init__(self,a,b,c):
        self.a=a
        self.b=b
        self.c=c
    def __str__(self):
        return f"#{self.a} {self.b} {self.c}#"
    def __repr__(self): return str(self)

obj = [O(a,a**4,1.0/a) for a in range(2,20)]

print(obj)

# use a generator to make 3-tuples of your classes attributes and decompose 
# those into zip which builds your lists
a,b,c  = map(list, zip( *((e.a,e.b,e.c) for e in obj)) )

print(a,b,c )

Объекты:

[#2 16 0.5#, #3 81 0.3333333333333333#, #4 256 0.25#, #5 625 0.2#, 
 #6 1296 0.16666666666666666#, #7 2401 0.14285714285714285#, #8 4096 0.125#,
 #9 6561 0.1111111111111111#, #10 10000 0.1#, #11 14641 0.09090909090909091#, 
 #12 20736 0.08333333333333333#, #13 28561 0.07692307692307693#, 
 #14 38416 0.07142857142857142#, #15 50625 0.06666666666666667#, 
 #16 65536 0.0625#, #17 83521 0.058823529411764705#, 
 #18 104976 0.05555555555555555#, #19 130321 0.05263157894736842#]

Результат:

[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 

[16, 81, 256, 625, 1296, 2401, 4096, 6561, 10000, 14641, 20736, 28561, 
 38416, 50625, 65536, 83521, 104976, 130321] 

[0.5, 0.3333333333333333, 0.25, 0.2, 0.16666666666666666, 0.14285714285714285, 
 0.125, 0.1111111111111111, 0.1, 0.09090909090909091, 0.08333333333333333,
 0.07692307692307693, 0.07142857142857142, 0.06666666666666667, 0.0625, 
 0.058823529411764705, 0.05555555555555555, 0.05263157894736842]

Вам все равно придется измерять, если это быстрее, чем проходить черезсписок объектов трижды.

И даже еслидля 18 элементов это будет медленнее, для 2 миллионов - быстрее.Таким образом, очень случайно, что использовать.


Время:

s = """
class O:
    def __init__(self,a,b,c):
        self.a=a
        self.b=b
        self.c=c
    def __str__(self):
        return f"#{self.a} {self.b} {self.c}#"
    def __repr__(self): return str(self)

# changed to ** 2 instead of 4
# changed to 200 elements
obj = [O(a,a**2,1.0/a) for a in range(2,200)] 
"""

code1="""
a,b,c  = map(list,zip( *((e.a,e.b,e.c) for e in obj))  )
"""
code2="""
a1 = [e.a for e in obj]
b1 = [e.b for e in obj]
c1 = [e.c for e in obj]
"""

from timeit import timeit

print(timeit(code1,setup=s,number=100000))
print(timeit(code2,setup=s,number=100000))

Результат:

7.969175090000135  # map + zip
5.124133489000087  # simple loop
...