Урожай только -2 стандартное отклонение - PullRequest
0 голосов
/ 19 января 2020

в следующей гистограмме есть части, которые ниже 0 и пик сразу после 0, я хотел удалить их, поэтому я решил удалить 2-ую базу данных, но, похоже, код обрезает 2-е число в конце и в начале .

Спасибо.

import pandas as pd
import random as r
import numpy as np


 df = pd.read_csv('D:\\Project\\database\\3-Last\\LastCombineHalf.csv')
df[df.apply(lambda x :(x-x.mean()).abs()<(2*x.std()) ).all(1)]
df.to_csv('D:\\Project\\database\\3-Last\\Removal.csv', index=False)

enter image description here

1 Ответ

0 голосов
/ 19 января 2020

Попробуйте,

получить стандартное отклонение столбца, используя .std ()

dev=df['col_name'].std()

, затем отфильтровав данные, которые вы выводите на гистограмму,

df[df['hist_data']>=2*dev]

хотя в таком спектре я бы установил LLD (дискриматор нижнего уровня) и просто отключил его, как описано выше.

Как это,

filtered_data = df[df['hist_data']>=0]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...