Сброс выбросов в таймфрейме временных рядов до 3 SD - PullRequest
0 голосов
/ 22 ноября 2018

Домен: Python & Pandas

У меня есть фрейм данных временного ряда, в котором содержится общее количество клиентов за каждый день за последние 10 лет.

Столбцы:

  • дата
  • всего клиентов

В моем столбце общих клиентов есть выбросы.

Я хотел сбросить выбросы за пределы 3 стандартных отклонений выше среднего до значения, определенного по формуле ниже.

Выброс выше 3SD = Среднее + 3 SD

1 Ответ

0 голосов
/ 22 ноября 2018

Вы можете использовать метод .clip_upper(), чтобы ограничить значения в столбце клиентов средним значением + 3 * sd.

m = df['total customers'].mean()
sd = df['total customers'].std()
df['total customers'] = df['total_customers'].clip_upper(m + 3*sd)

Вот документация для clip_upper.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...