Как рассчитать сводное значение по данным OHLC с несколькими столбцами groupby - PullRequest
1 голос
/ 20 мая 2019

У меня есть набор данных pandas с столбцами open, high, low, close, key1 и key2. Теперь я хочу сгруппировать набор данных по ключам key1 и key2 и рассчитать пивот по формуле - (high + low + close) / 3. До этого я мог это сделать. Но требование состоит в том, чтобы переместить вычисленные данные в следующую группу, которую я не могу закодировать.

Я могу сгруппировать набор данных по столбцам key1 и key2 и рассчитать сводные данные по приведенному ниже коду, но не могу сместить значения в следующей группе.

import pandas as pd

data = pd.DataFrame([[110, 115, 105, 111, 1, 2],[11, 16, 6, 12, 1, 2],[12, 17, 7, 13, 1, 3],[22, 25, 17, 20, 1, 3],[12, 16, 6, 11, 2, 4],[32, 36, 26, 28, 2, 4],[9, 13, 4, 13, 2, 5],[49, 53, 40, 45, 2, 5],[13, 18, 9, 12, 3, 6],[14, 16, 10, 13, 3, 6]], columns=["open","high","low","close","key1", "key2"])
s = (data.high.groupby([data.key1, data.key2]).max() + data.low.groupby([data.key1, data.key2]).min() + data.close.groupby([data.key1, data.key2]).last()) / 3
#data['pivot'] = data['key1', 'key2'].map(s.shift())
print(data)

Когда я использую код ниже,

import pandas as pd

data = pd.DataFrame([[110, 115, 105, 111, 1, 2],[11, 16, 6, 12, 1, 2],[12, 17, 7, 13, 1, 3],[22, 25, 17, 20, 1, 3],[12, 16, 6, 11, 2, 4],[32, 36, 26, 28, 2, 4],[9, 13, 4, 13, 2, 5],[49, 53, 40, 45, 2, 5],[13, 18, 9, 12, 3, 6],[14, 16, 10, 13, 3, 6]], columns=["open","high","low","close","key1", "key2"])
data['pivot'] = (data.high.groupby([data.key1, data.key2]).transform('max') + data.low.groupby([data.key1, data.key2]).transform('min') + data.close.groupby([data.key1, data.key2]).transform('last')) / 3
print(data)

Я получаю ниже вывода.

   open  high  low  close  key1  key2      pivot
0   110   115  105    111     1     2  44.333333
1    11    16    6     12     1     2  44.333333
2    12    17    7     13     1     3  17.333333
3    22    25   17     20     1     3  17.333333
4    12    16    6     11     2     4  23.333333
5    32    36   26     28     2     4  23.333333
6     9    13    4     13     2     5  34.000000
7    49    53   40     45     2     5  34.000000
8    13    18    9     12     3     6  13.333333
9    14    16   10     13     3     6  13.333333

Но ожидаемый результат:

   open  high  low  close  key1  key2     pivot
0   110   115  105    111     1     2      NaN
1    11    16    6     12     1     2      NaN
2    12    17    7     13     1     3   44.333333
3    22    25   17     20     1     3   44.333333
4    12    16    6     11     2     4   17.333333
5    32    36   26     28     2     4   17.333333
6     9    13    4     13     2     5   23.333333
7    49    53   40     45     2     5   23.333333
8    13    18    9     12     3     6   34.000000
9    14    16   10     13     3     6   34.000000

1 Ответ

0 голосов
/ 20 мая 2019

Сначала используйте функцию агрегирования со словарем и GroupBy.agg, а затем для нового столбца DataFrame.join с shift:

s = data.groupby(['key1','key2']).agg({'low':'min','high':'max','close':'last'}).sum(axis=1)/3

data = data.join(s.rename('pivot').shift(), on=['key1','key2'])
print (data)
   open  high  low  close  key1  key2      pivot
0   110   115  105    111     1     2        NaN
1    11    16    6     12     1     2        NaN
2    12    17    7     13     1     3  44.333333
3    22    25   17     20     1     3  44.333333
4    12    16    6     11     2     4  17.333333
5    32    36   26     28     2     4  17.333333
6     9    13    4     13     2     5  23.333333
7    49    53   40     45     2     5  23.333333
8    13    18    9     12     3     6  34.000000
9    14    16   10     13     3     6  34.000000
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...