Цель: создать подмножество исходных данных на основе dtype
Как использовать NumPy для создания подмножества столбцов на основе dtypes.Более конкретно, используя приведенный ниже пример, как я могу создать объект NumPy, который содержит только значения с плавающей точкой ('<f8')
в новом наборе данных.
Example
--------
>>> df = pd.DataFrame({'A': [1, 2], 'B': [0.5, 0.75]},
... index=['a', 'b'])
>>> df
A B
a 1 0.50
b 2 0.75
>>> df.to_records()
rec.array([('a', 1, 0.5 ), ('b', 2, 0.75)],
dtype=[('index', 'O'), ('A', '<i8'), ('B', '<f8')])
РЕДАКТИРОВАТЬ: Я надеялся, что яможет использовать что-то вроде следующего:
np.where(my_np_array.dtype==[('int64')])
, что даст мне все столбцы с '<i8'
и исключит все столбцы '<f8'
в приведенном выше примере.