Снизьте выборку Pandas, но сохраните данные из некоторых столбцов - PullRequest
0 голосов
/ 11 июня 2019

У меня есть DataFrame с четырьмя столбцами, индексированными по временным меткам с 4 столбцами.

Что мне нужно сделать, это пересчитать его до среднего значения, например, 20 минут, но добавить еще три столбца впроцесс, который сохранит все выбранные значения из исходного DataFrame.Это сделало бы из фрейма данных

                     'value1'    'value2'    'value3'

timestamp_1            value      value       value 
timestamp_2            value      value       value 
timestamp_3            value      value       value 
timestamp_4            value      value       value 
                       '''
[12656215 rows x 4 columns]

сделать НЕ просто новый фрейм данных

                     'value1'    'value2'    'value3'

mean_timestamp_1    mean_value   mean_value  mean_value 
mean_timestamp_2    mean_value   mean_value  mean_value 
mean_timestamp_3    mean_value   mean_value  mean_value 
mean_timestamp_4    mean_value   mean_value  mean_value 
                       '''
[72 rows x 4 columns]

, который создается

df.resample('20min', loffset = '10min').mean()

, но создать фрейм данных, которыйтакже содержит значения из предыдущего DataFrame внутри нового, например

                     'value1'    'value2'    'value3'                  'old_values1'                                 'old_values2'                                   'old_values3'

mean_timestamp_1    mean_value   mean_value  mean_value [old_value_11, old_value_12, old_value_13 ...] [old_value_21, old_value_22, old_value_23 ...] [old_value_31, old_value_32, old_value_33 ...]
mean_timestamp_2    mean_value   mean_value  mean_value [old_value_11, old_value_12, old_value_13 ...] [old_value_21, old_value_22, old_value_23 ...] [old_value_31, old_value_32, old_value_33 ...]
mean_timestamp_3    mean_value   mean_value  mean_value [old_value_11, old_value_12, old_value_13 ...] [old_value_21, old_value_22, old_value_23 ...] [old_value_31, old_value_32, old_value_33 ...]
mean_timestamp_4    mean_value   mean_value  mean_value [old_value_11, old_value_12, old_value_13 ...] [old_value_21, old_value_22, old_value_23 ...] [old_value_31, old_value_32, old_value_33 ...]

, поэтому присоедините один массив значений из предыдущего DataFrame к новому поверх пересчитанных средств.

Может ли этобыть сделано с помощью только встроенных команд, потому что я использую очень большой набор данных, и эффективность очень важна?

...