Преобразование numpy dtypes в нативные типы Python - PullRequest
182 голосов
/ 26 февраля 2012

Если у меня есть пустой тип dtype, как мне автоматически преобразовать его в ближайший тип данных python?Например,

numpy.float32 -> "python float"
numpy.float64 -> "python float"
numpy.uint32  -> "python int"
numpy.int16   -> "python int"

Я мог бы попытаться придумать отображение всех этих случаев, но предоставляет ли numpy какой-то автоматический способ преобразования своих dty-типов в наиболее близкие возможные нативные типы python?Это отображение не должно быть исчерпывающим, но оно должно преобразовывать общие dtypes, которые имеют близкий аналог python.Я думаю, что это уже происходит где-то в NumPy.

Ответы [ 11 ]

248 голосов
/ 09 июля 2012

Используйте val.item() для преобразования большинства значений NumPy в собственный тип Python:

import numpy as np

# for example, numpy.float32 -> python float
val = np.float32(0)
pyval = val.item()
print(type(pyval))         # <class 'float'>

# and similar...
type(np.float64(0).item()) # <class 'float'>
type(np.uint32(0).item())  # <class 'long'>
type(np.int16(0).item())   # <class 'int'>
type(np.cfloat(0).item())  # <class 'complex'>
type(np.datetime64(0, 'D').item())  # <class 'datetime.date'>
type(np.datetime64('2001-01-01 00:00:00').item())  # <class 'datetime.datetime'>
type(np.timedelta64(0, 'D').item()) # <class 'datetime.timedelta'>
...

(Другой метод - np.asscalar(val), однако с NumPy 1.16 он не рекомендуется).


Для любопытных: составить таблицу преобразований Скалярные массивы NumPy для вашей системы:

for name in dir(np):
    obj = getattr(np, name)
    if hasattr(obj, 'dtype'):
        try:
            if 'time' in name:
                npn = obj(0, 'D')
            else:
                npn = obj(0)
            nat = npn.item()
            print('{0} ({1!r}) -> {2}'.format(name, npn.dtype.char, type(nat)))
        except:
            pass

Существует несколько типов NumPy, которые не имеют собственного Python-эквивалента в некоторых системах, включая: clongdouble, clongfloat, complex192, complex256, float128, longcomplex, longdouble и longfloat. Их необходимо преобразовать в ближайший эквивалент NumPy перед использованием .item().

39 голосов
/ 24 апреля 2013

обнаружил, что я смешал набор типов numpy и стандартный python. так как все типы numpy являются производными от numpy.generic, вот как вы можете преобразовать все в стандартные типы Python:

if isinstance(obj, numpy.generic):
    return numpy.asscalar(obj)
10 голосов
/ 26 февраля 2012

Как насчет:

In [51]: dict([(d, type(np.zeros(1,d).tolist()[0])) for d in (np.float32,np.float64,np.uint32, np.int16)])
Out[51]: 
{<type 'numpy.int16'>: <type 'int'>,
 <type 'numpy.uint32'>: <type 'long'>,
 <type 'numpy.float32'>: <type 'float'>,
 <type 'numpy.float64'>: <type 'float'>}
9 голосов
/ 21 марта 2017

Если вы хотите преобразовать (numpy.array ИЛИ numpy скаляр или ИЛИ собственный тип ИЛИ numpy.darray) в нативный тип, вы можете просто сделать:

converted_value = getattr(value, "tolist", lambda x=value: x)()

tolist преобразует ваш скаляр или массив в нативный Pythonтип.Лямбда-функция по умолчанию заботится о случае, когда значение уже является собственным.

7 голосов
/ 05 марта 2014

Вы также можете вызвать item() метод объекта, который хотите преобразовать:

>>> from numpy import float32, uint32
>>> type(float32(0).item())
<type 'float'>
>>> type(uint32(0).item())
<type 'long'>
6 голосов
/ 30 октября 2018

tolist() - более общий подход для достижения этой цели.Он работает в любом примитиве dtype, а также в массивах или матрицах.

На самом деле я не получаю список при вызове из примитивных типов:

numpy == 1.15.2

>>> import numpy as np

>>> np_float = np.float64(1.23)
>>> print(type(np_float), np_float)
<class 'numpy.float64'> 1.23

>>> listed_np_float = np_float.tolist()
>>> print(type(listed_np_float), listed_np_float)
<class 'float'> 1.23

>>> np_array = np.array([[1,2,3.], [4,5,6.]])
>>> print(type(np_array), np_array)
<class 'numpy.ndarray'> [[1. 2. 3.]
 [4. 5. 6.]]

>>> listed_np_array = np_array.tolist()
>>> print(type(listed_np_array), listed_np_array)
<class 'list'> [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]]
6 голосов
/ 26 февраля 2012

Я думаю, что вы можете просто написать общую функцию преобразования типов следующим образом:

import numpy as np

def get_type_convert(np_type):
   convert_type = type(np.zeros(1,np_type).tolist()[0])
   return (np_type, convert_type)

print get_type_convert(np.float32)
>> (<type 'numpy.float32'>, <type 'float'>)

print get_type_convert(np.float64)
>> (<type 'numpy.float64'>, <type 'float'>)

Это означает, что нет фиксированных списков, и ваш код будет масштабироваться с большим количеством типов.

2 голосов
/ 21 января 2016

numpy содержит эту информацию в отображении, отображаемую как typeDict, поэтому вы можете сделать что-то вроде следующего: *

>>> import __builtin__
>>> import numpy as np
>>> {v: k for k, v in np.typeDict.items() if k in dir(__builtin__)}
{numpy.object_: 'object',
 numpy.bool_: 'bool',
 numpy.string_: 'str',
 numpy.unicode_: 'unicode',
 numpy.int64: 'int',
 numpy.float64: 'float',
 numpy.complex128: 'complex'}

Если вы хотите использовать фактические типы Python, а не их имена, вы можете сделать::

>>> {v: getattr(__builtin__, k) for k, v in np.typeDict.items() if k in vars(__builtin__)}
{numpy.object_: object,
 numpy.bool_: bool,
 numpy.string_: str,
 numpy.unicode_: unicode,
 numpy.int64: int,
 numpy.float64: float,
 numpy.complex128: complex}
1 голос
/ 21 июня 2019

Извините, что опоздал на часть, но я искал проблему преобразования numpy.float64 в обычный Python float.Я видел 3 способа сделать это:

  1. npValue.item()
  2. npValue.astype(float)
  3. float(npValue)

Вотсоответствующие сроки из IPython:

In [1]: import numpy as np

In [2]: aa = np.random.uniform(0, 1, 1000000)

In [3]: %timeit map(float, aa)
10 loops, best of 3: 117 ms per loop

In [4]: %timeit map(lambda x: x.astype(float), aa)
1 loop, best of 3: 780 ms per loop

In [5]: %timeit map(lambda x: x.item(), aa)
1 loop, best of 3: 475 ms per loop

Похоже, float(npValue) кажется гораздо быстрее.

0 голосов
/ 17 июля 2019

Мой подход немного силен, но, похоже, подходит для всех случаев:

def type_np2py(dtype=None, arr=None):
    '''Return the closest python type for a given numpy dtype'''

    if ((dtype is None and arr is None) or
        (dtype is not None and arr is not None)):
        raise ValueError(
            "Provide either keyword argument `dtype` or `arr`: a numpy dtype or a numpy array.")

    if dtype is None:
        dtype = arr.dtype

    #1) Make a single-entry numpy array of the same dtype
    #2) force the array into a python 'object' dtype
    #3) the array entry should now be the closest python type
    single_entry = np.empty([1], dtype=dtype).astype(object)

    return type(single_entry[0])

Использование:

>>> type_np2py(int)
<class 'int'>

>>> type_np2py(np.int)
<class 'int'>

>>> type_np2py(str)
<class 'str'>

>>> type_np2py(arr=np.array(['hello']))
<class 'str'>

>>> type_np2py(arr=np.array([1,2,3]))
<class 'int'>

>>> type_np2py(arr=np.array([1.,2.,3.]))
<class 'float'>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...