В настоящее время я работаю над некоторым простым DataFrame, и после измерения его производительности я столкнулся со странным поведением.Вот проблемный фрагмент кода:
import pandas as pd
import time
df = pd.DataFrame(0, index=list(range(6)), columns=['rand', 'result'])
df['rand'] = [0.15, 0.07, 0.74, 0.37, 0.54, 0.07]
time_start = time.time()
df['result'] = df['rand'] / 2 #Here lays the problem
time_end = time.time()
print ('Generating calulation took: %.7f sec' % (time_end - time_start))
Все работает хорошо, но производительность хуже, чем плохая.Это простое вычисление занимает около 0,7 секунды.Для однократного использования это может быть терпимо, но это часть конструктора класса со многими экземплярами, поэтому это совершенно неприемлемо.Есть идеи по оптимизации этого кода?