Есть ли какая-либо стандартная функция, которая показывает мне, когда произошли ВЫСОКИЙ и НИЗКИЙ преобразования OHLC? - PullRequest
0 голосов
/ 25 мая 2019

Я могу конвертировать тиковые данные, а также могу повторно сэмплировать их с помощью функции resample панд. Смотрите код ниже.

Существует ли какая-либо стандартная функциональность numpy / pandas / ...., которая возвращает мне моменты времени, когда произошли значения high и low?

Я бы хотел, чтобы эти даты и время были в виде двух дополнительных столбцов в кадре данных результата.

import numpy as np
import pandas as pd
np.random.seed(1)
data = np.random.rand(500)
myRange = pd.date_range('2018-04-09', periods=500, freq='50s')

df = pd.DataFrame(data,myRange)
df.columns = ['price']

dfOHLC = df.price.resample('1h').ohlc()

dfOHLC_resampled = df.resample('2h').agg({'open': 'first',
                                        'high': 'max',
                                        'low': 'min',
                                        'close': 'last',
                                        })
print(dfOHLC)
#                          open      high       low     close
# 2018-04-09 00:00:00  0.417022  0.988861  0.000114  0.137475
# 2018-04-09 01:00:00  0.139276  0.997323  0.002870  0.121343
# 2018-04-09 02:00:00  0.044552  0.988616  0.012556  0.505662
# 2018-04-09 03:00:00  0.021525  0.976759  0.000402  0.802161
# 2018-04-09 04:00:00  0.572489  0.990472  0.022330  0.990472
# 2018-04-09 05:00:00  0.300248  0.993913  0.018333  0.450087
# 2018-04-09 06:00:00  0.478073  0.989955  0.003018  0.227900

print(dfOHLC_resampled)
#                          open      high       low     close
#                         price     price     price     price
# 2018-04-09 00:00:00  0.417022  0.997323  0.000114  0.121343
# 2018-04-09 02:00:00  0.044552  0.988616  0.000402  0.802161
# 2018-04-09 04:00:00  0.572489  0.993913  0.018333  0.450087
# 2018-04-09 06:00:00  0.478073  0.989955  0.003018  0.227900

1 Ответ

1 голос
/ 25 мая 2019

В версии pandas 0.24+ возможно использование Series.idxmax и Series.idxmin:

dfOHLC_resampled = dfOHLC.resample('2h').agg({'open': 'first',
                                        'high': ['max', 'idxmax'],
                                        'low': ['min', 'idxmin'],
                                        'close': 'last',
                                        })
print(dfOHLC_resampled)
                         open      high                           low  \
                        first       max              idxmax       min   
2018-04-09 00:00:00  0.417022  0.997323 2018-04-09 01:00:00  0.000114   
2018-04-09 02:00:00  0.044552  0.988616 2018-04-09 02:00:00  0.000402   
2018-04-09 04:00:00  0.572489  0.993913 2018-04-09 05:00:00  0.018333   
2018-04-09 06:00:00  0.478073  0.989955 2018-04-09 06:00:00  0.003018   

                                            close  
                                 idxmin      last  
2018-04-09 00:00:00 2018-04-09 00:00:00  0.121343  
2018-04-09 02:00:00 2018-04-09 03:00:00  0.802161  
2018-04-09 04:00:00 2018-04-09 05:00:00  0.450087  
2018-04-09 06:00:00 2018-04-09 06:00:00  0.227900  
...