Как удалить определенные значения строки (не нуль) в панде данных - PullRequest
0 голосов
/ 10 марта 2019

, поэтому я получил набор данных IOT и хочу удалить определенные строки на основе значений столбца «Значение» ( они не являются нулевыми значениями ). Например, -

PFA снимок экрана набора данных

поэтому в основном я хочу удалить все строки, у которых есть «Потерянные данные» в столбце «Значение». В этом наборе данных более 50 тыс. Записей, и я попробовал описанный ниже метод, но он не сработал

df2 = df1[(df1['Value']!='Data Lost')]
df2 = df1[(df1['Value']!='I/O TimeOut')]

Был бы очень признателен за любую помощь!

1 Ответ

0 голосов
/ 10 марта 2019

Предположим, ваш df выглядит так:

   ID         Col1       date       Value
0  18     Gas Flow 2019-02-03         64↓
1  19  Temperature 2019-02-03         73↓
2  20          No2 2019-02-03     Medium↓
3  21          RPM 2019-02-03       1006↓
4  22    Vibration 2019-02-03         72↓
5  23          No2 2019-02-03  Data Lost↓
6  24     Gas Flow 2019-02-03         69↓

Вы можете сделать series.str.contains():

df1=df[~df.Value.str.contains('Data Lost',case=False,na=False)]
print(df1)

   ID         Col1       date    Value
0  18     Gas Flow 2019-02-03      64↓
1  19  Temperature 2019-02-03      73↓
2  20          No2 2019-02-03  Medium↓
3  21          RPM 2019-02-03    1006↓
4  22    Vibration 2019-02-03      72↓
6  24     Gas Flow 2019-02-03      69↓

Примечание: используйте case=False, если вы хотите, чтобы поиск не учитывал регистр, также используйте na=False, если в столбце NaN.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...