Как заполнить первую ячейку N / A при применении скользящего среднего к столбцу-Python - PullRequest
0 голосов
/ 26 июня 2018

Мне нужно применить скользящее среднее к столбцу, как показано на рисунке 1 s3, после того, как я применил скользящее среднее и установив windows = 5, я получил правильный ответ, но оставил первые 4 строки пустыми, как показано на рисунке 2 sa3.

Я хочу заполнить первые 4 пустые ячейки в pic2 sa3 средним значением всех данных в pic1 s3 до текущей строки, как показано на pic3 a3.

как я могу сделать с простой функцией, кроме метода скользящего среднего. pic1

pic2

pic3

Ответы [ 3 ]

0 голосов
/ 26 июня 2018

Вы можете использовать панд, чтобы найти скользящее среднее, а затем заполнить NaN нулем.

Используйте что-то вроде следующего:

col = [1,2,3,4,5,6,7,8,9]
df = pd.DataFrame(col)

df['rm'] = df.rolling(5).mean().fillna(value =0, inplace=False)
print df

   0   rm
0  1  0.0
1  2  0.0
2  3  0.0
3  4  0.0
4  5  3.0
5  6  4.0
6  7  5.0
7  8  6.0
8  9  7.0
0 голосов
/ 26 июня 2018

Мне кажется, нужен параметр min_periods=1 в rolling:

min_periods: int, по умолчанию None

Минимальное количество наблюдений в окне, которое должно иметь значение (в противном случае результат равен NA). Для окна, заданного смещением, по умолчанию оно будет равно 1.

df = df.rolling(5, min_periods=1).mean()

Пример

np.random.seed(1256)

df = pd.DataFrame(np.random.randint(10, size=(10, 5)), columns=list('abcde'))
print (df)
   a  b  c  d  e
0  1  5  8  8  9
1  3  6  3  0  6
2  7  0  1  5  1
3  6  6  5  0  4
4  4  9  4  6  1
5  7  7  5  8  3
6  0  7  2  8  2
7  4  8  3  5  5
8  8  2  0  9  2
9  4  7  1  5  1

df = df.rolling(5, min_periods=1).mean()
print (df)
          a         b     c         d         e
0  1.000000  5.000000  8.00  8.000000  9.000000
1  2.000000  5.500000  5.50  4.000000  7.500000
2  3.666667  3.666667  4.00  4.333333  5.333333
3  4.250000  4.250000  4.25  3.250000  5.000000
4  4.200000  5.200000  4.20  3.800000  4.200000
5  5.400000  5.600000  3.60  3.800000  3.000000
6  4.800000  5.800000  3.40  5.400000  2.200000
7  4.200000  7.400000  3.80  5.400000  3.000000
8  4.600000  6.600000  2.80  7.200000  2.600000
9  4.600000  6.200000  2.20  7.000000  2.600000
0 голосов
/ 26 июня 2018

Итак, вы хотите добавить:

df['sa3'].fillna(df['s3'].mean(), inplace=True)

Надеюсь, я использовал правильные имена столбцов.

...