Заменить ноль на предыдущее ненулевое значение - PullRequest
0 голосов
/ 01 февраля 2019

У меня есть переменная индикатора в моем фрейме данных, которая принимает значения 1 0 или -1.Я хотел бы создать новую переменную, которая избегает 0 и вместо этого повторяет ненулевые значения переменной индикатора, пока она не изменится на 1 или -1.

Я пробовал различные конструкции, используя оператор np.where, но не могу решить эту проблему.

Вот исходный кадр данных:

import pandas as pd
df = pd.DataFrame(
{'Date': [1,2,3,4,5,6,7,8,9,10],
'Ind': [1,0,0,-1,0,0,0,1,0,0]})
df

enter image description here

Я надеюсь получить кадр данных, который выглядит следующим образом:

df2 = pd.DataFrame(
{'Date': [1,2,3,4,5,6,7,8,9,10],
'Ind': [1,0,0,-1,0,0,0,1,0,0],
'NewVar':[1,1,1,-1,-1,-1,-1,1,1,1]})

enter image description here

Ответы [ 2 ]

0 голосов
/ 01 февраля 2019

Использование reindex

df.Ind[df.Ind!=0].reindex(df.index,method='ffill')
0    1
1    1
2    1
3   -1
4   -1
5   -1
6   -1
7    1
8    1
9    1
Name: Ind, dtype: int64
0 голосов
/ 01 февраля 2019

Используйте mask и ffill:

df['Ind'].mask(df['Ind'] == 0).ffill()

0    1.0
1    1.0
2    1.0
3   -1.0
4   -1.0
5   -1.0
6   -1.0
7    1.0
8    1.0
9    1.0
Name: Ind, dtype: float64

df['Ind'].mask(df['Ind'] == 0).ffill(downcast='infer')

0    1
1    1
2    1
3   -1
4   -1
5   -1
6   -1
7    1
8    1
9    1
Name: Ind, dtype: int64

Другой вариант - использование groupby и transform с использованием группировщика, образованного из cumsum:

df.groupby(df['Ind'].ne(0).cumsum())['Ind'].transform('first')

0    1
1    1
2    1
3   -1
4   -1
5   -1
6   -1
7    1
8    1
9    1
Name: Ind, dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...