Сравните движущееся окно pandas со списком, чтобы найти окно с наименьшей ошибкой - PullRequest
3 голосов
/ 22 апреля 2020

Я сократил свой набор данных до последних нескольких шагов. Мой pandas фрейм данных выглядит следующим образом

    FAC
0   1
1   2
2   1
3   3
4   2
5   1
6   2
7   1
8   1
9   3
10  2
11  1
12  2
13  3
14  1

У меня также есть список, который я определил, чтобы соответствовать.

match_list = [1, 2, 1, 1, 3]

, что я ищу, это слайд (5 пункт окно) столбец фрейма данных и найдите строку, которая соответствует шаблону списка. Конечный результат выглядит примерно так. Буду благодарен за любую помощь.

    FAC Error
0   1   some val
1   2   some val
2   1   some val
3   3   some val
4   2   some val
5   1   some val
6   2   some val
7   1   0
8   1   some val
9   3   some val
10  2   some val
11  1   some val
12  2   some val
13  3   some val
14  1   some val

1 Ответ

2 голосов
/ 22 апреля 2020

Это можно сделать с помощью rolling:

match_list = [1, 2, 1, 1, 3]
match_list = np.array(match_list)

def match(x):
    return (len(x)==len(match_list) and (x==match_list).all())


df['error'] = np.where(df.FAC.rolling(5, center=True).apply(match)==1, 0, 'some value')

Вывод:

    FAC       error
0     1  some value
1     2  some value
2     1  some value
3     3  some value
4     2  some value
5     1  some value
6     2  some value
7     1           0
8     1  some value
9     3  some value
10    2  some value
11    1  some value
12    2  some value
13    3  some value
14    1  some value

Обновление : для подсчета совпадений вы можете просто сделайте mean вместо all внутри функции:

def count_match(x):
    return (len(x)==len(match_list))* (x==match_list).mean()

df['error'] = df.FAC.rolling(5,center=True).apply(count_match)

Вывод:

    FAC  error
0     1    NaN
1     2    NaN
2     1    0.6
3     3    0.0
4     2    0.4
5     1    0.4
6     2    0.2
7     1    1.0
8     1    0.2
9     3    0.2
10    2    0.4
11    1    0.6
12    2    0.0
13    3    NaN
14    1    NaN
...