возвращаемое значение на основе результата суммы строк в отдельном столбце - PullRequest
0 голосов
/ 07 июля 2019

Я пытаюсь создать новый столбец (столбец D), который возвращает значение CLOSE, если в любое время в следующих 5 строках (см. Выше) изменение значения во время SELL (т. Е. 452.37) достигает более низкого значения 5%. (т.е. 452.37 / 1.05 = 432.85), что происходит в строке 5.

Мой фрейм данных выглядит следующим образом, и строка D - это то, на что я хотел бы выглядеть

df = pd.DataFrame()

df['A'] = ('1/05/2019','2/05/2019','3/05/2019','4/05/2019','5/05/2019',
           '6/05/2019','7/05/2019','8/05/2019','9/05/2019','10/05/2019')
df['B'] = (460.97, 454.50, 439.00, 438.04, 433.00,
           428.01, 440.00, 437.69, 452.37, 455.93)
df['C'] = ('-', '-', '-', '-', '-', '-', '-', '-', 'SELL', '-')
df['D'] = ('-', '-', '-', '-', '-', 'CLOSE', '-', '-', '-', '-')

print(df)

1 Ответ

1 голос
/ 07 июля 2019

Исходя из приведенного описания, кажется, что вы можете комбинировать смещение B, вычисление максимума прокатки и сравнение этого максимума прокатки с текущим значением B:

df['D2'] = np.where((pd.Series(np.where(df['C'] == 'SELL', 
                    df['B'],
                    0)).shift(-5).rolling(5, min_periods=1).max() / df['B']) > 1.05,
                    'CLOSE',
                    '-')
print(df)

возвращает

            A       B     C      D     D2
0   1/05/2019  460.97     -      -      -
1   2/05/2019  454.50     -      -      -
2   3/05/2019  439.00     -      -      -
3   4/05/2019  438.04     -      -      -
4   5/05/2019  433.00     -      -      -
5   6/05/2019  428.01     -  CLOSE  CLOSE
6   7/05/2019  440.00     -      -      -
7   8/05/2019  437.69     -      -      -
8   9/05/2019  452.37  SELL      -      -
9  10/05/2019  455.93     -      -      -
...