Удалите строки в кадре данных pandas, где столбец не соответствует типу данных - PullRequest
0 голосов
/ 12 ноября 2018

У меня есть датафрейм df, который выглядит следующим образом:

A     B    C
abc   10   20
def   30   50  
cfg   90   60
70   str  50
xyz   75   56

Я хочу избавиться от 4-го ряда, где типы данных не совпадают

Мой код:

df = pd.read_csv(file_path+files, delimiter='\t', error_bad_lines=False)
df.dtypes
A       object
B        int64
C       object
dtype: object

1 Ответ

0 голосов
/ 12 ноября 2018

Я собираюсь выйти на конечность и сказать, что это не тривиальная проблема, которую нужно решить, если вы не знаете, что такое dtypes вашего столбца.

Для решения этой проблемы я предполагаю, что в вашем DataFrame есть только строки и числовые типы.

v = df.apply(pd.to_numeric, errors='coerce').isna() 
df[~((x.mean() >=.5) ^ x)].dropna()

     A   B   C
0  abc  10  20
1  def  30  50
2  cfg  90  60
4  xyz  75  56

Идея состоит в том, чтобы отбросить строки, которые не разделяют dtype большинства ваших данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...