У меня есть числовой повторный массив с несколькими целочисленными столбцами и некоторыми строковыми столбцами.Данные в строковых столбцах составлены на 99% из целых чисел, но это просто строка, потому что в столбце указано «NA».
Итак, у меня два вопроса:
Как мне удалить NA и изменить их на 0?
Как я могу преобразовать строковые столбцы в целые числа, чтобы у меня был массив записей со многими целочисленными столбцами?
Спасибо.
Используйте where и astype:
where
astype
>>> x = np.array([123, 456, "789", "NA", "0", 0]) >>> x array(['123', '456', '789', 'NA', '0', '0'], dtype='|S8') >>> np.where(x != 'NA', x, 0).astype(int) array([123, 456, 789, 0, 0, 0])