Преобразование типов данных столбца в массиве записей - PullRequest
4 голосов
/ 24 сентября 2011

У меня есть числовой повторный массив с несколькими целочисленными столбцами и некоторыми строковыми столбцами.Данные в строковых столбцах составлены на 99% из целых чисел, но это просто строка, потому что в столбце указано «NA».

Итак, у меня два вопроса:

  • Как мне удалить NA и изменить их на 0?

  • Как я могу преобразовать строковые столбцы в целые числа, чтобы у меня был массив записей со многими целочисленными столбцами?

Спасибо.

1 Ответ

3 голосов
/ 24 сентября 2011

Используйте where и astype:

>>> x = np.array([123, 456, "789", "NA", "0", 0])
>>> x 
array(['123', '456', '789', 'NA', '0', '0'], dtype='|S8')
>>> np.where(x != 'NA', x, 0).astype(int)
array([123, 456, 789,   0,   0,   0])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...