Преобразование данных тиков в данные подсвечника OHLCV - PullRequest
0 голосов
/ 08 ноября 2018

Моя основная программа Соберите данные тиков с сервера и сохраните эти данные в текстовом файле. Пример данных в кадре выглядит следующим образом:

SYMBOL_N    PRICE   DATE        TIME        VOLUME
35324399    92.31   02/11/18    12:45:26    108856
35324399    92.32   02/11/18    12:45:26    108865
35324399    92.32   02/11/18    12:46:27    108896
35324399    92.38   02/11/18    12:46:28    108932
35324399    92.45   02/11/18    12:47:28    108988
35324399    92.48   02/11/18    12:47:30    109132
35324399    92.52   02/11/18    12:47:52    109256
35324399    92.57   02/11/18    12:48:31    109288
...
...
35324400    76.62   02/11/18    12:45:22    104569
35324400    76.66   02/11/18    12:46:33    104582
35324400    76.68   02/11/18    12:47:06    104602
35324400    76.68   02/11/18    12:47:12    104645
35324400    76.71   02/11/18    12:47:28    104724
35324400    76.74   02/11/18    12:48:29    104944
35324400    76.77   02/11/18    12:48:36    105074
35324400    76.79   02/11/18    12:48:42    106988

В фрейме данных есть несколько токенов. Я хочу преобразовать эти данные в подсвечник OHLCV за указанный период времени, например (1 мин, 3 мин, 5 мин). Опять же, Объем в Подсвечнике OHLCV должен быть разностью Максимального Объема (Предыдущая Свеча - Текущая Свеча) для указанного периода времени.

Пожалуйста, помогите.

1 Ответ

0 голосов
/ 08 ноября 2018

Это можно сделать с помощью resample .

Сначала я вычислил объем так, как вы просили, но я думаю, что вам на самом деле нужна разница между максимумом текущей свечи и максимумом предыдущей свечи. Это код:

timeframe = '1min'

tick_data['DATETIME'] = pd.to_datetime(tick_data['DATE'] + ' ' + tick_data['TIME'])
tick_data.set_index('DATETIME', inplace=True)

ohlcv_data = pd.DataFrame(columns=[
    'SYMBOL_N',
    'open',
    'high',
    'low',
    'close',
    'volume'])

for symbol in tick_data['SYMBOL_N'].unique():
    ohlcv_symbol =  tick_data.loc[tick_data['SYMBOL_N'] == symbol, 'PRICE'].resample(timeframe).ohlc()
    ohlcv_symbol['SYMBOL_N'] = symbol
    ohlcv_symbol['volume'] = (tick_data.loc[tick_data['SYMBOL_N'] == symbol, 'VOLUME'].resample(timeframe).max() - tick_data.loc[tick_data['SYMBOL_N'] == symbol, 'VOLUME'].resample(timeframe).max().shift(1))
    ohlcv_data = ohlcv_data.append(ohlcv_symbol, sort=False)

print(ohlcv_data)

И вот результат:

                     SYMBOL_N   open   high    low  close  volume
2018-02-11 12:45:00  35324399  92.31  92.32  92.31  92.32     NaN
2018-02-11 12:46:00  35324399  92.32  92.38  92.32  92.38    67.0
2018-02-11 12:47:00  35324399  92.45  92.52  92.45  92.52   324.0
2018-02-11 12:48:00  35324399  92.57  92.57  92.57  92.57    32.0
2018-02-11 12:45:00  35324400  76.62  76.62  76.62  76.62     NaN
2018-02-11 12:46:00  35324400  76.66  76.66  76.66  76.66    13.0
2018-02-11 12:47:00  35324400  76.68  76.71  76.68  76.71   142.0
2018-02-11 12:48:00  35324400  76.74  76.79  76.74  76.79  2264.0
...