конфликты типов данных - строки и числа с плавающей точкой в ​​одном NumpyArray - PullRequest
0 голосов
/ 14 мая 2018

У меня есть следующие массивы:

a = ['(0.0 | 0.0 | 0.0)', '(0.0 | 0.0 | 0.1)'] # strings
b = [0.0, 0.1] # floats
c = [0.0, 0.2] # floats
d = [0.0, 0.3] # floats
e = [0.0, 0.4] # floats

Моя цель состоит в том, чтобы создать окончательный 2-мерный массив так, чтобы типы данных были сохранены, с numpy:

final = [a, b, c, d, e] -> [ ['(0.0 | 0.0 | 0.0)', ...] , [0.0, 0.1], ... ]

Когда я пыталсячтобы сделать это с

np.array([a, b, c, d, e])

, получится, что числа с плавающей точкой преобразуются в строки.Естественно, я пошел посмотреть документацию по dtype из numpy dtype doc и попытался создать свой собственный dtype через

dt = np.dtype([('f1', np.str), ('f2', np.float), ('f3', np.float), ('f4', np.float), ('f5', np.float)])
final = np.array([a, b, c, d, e], dtype=dt)

Однако он пытается преобразовать строковый массив в числа с плавающей точкой:

ValueError: не удалось преобразовать строку в число с плавающей точкой: '(0.0 | 0.0 | 0.0)'

Кто-нибудь знает, что я делаю неправильно?Это должно быть возможно ...

1 Ответ

0 голосов
/ 14 мая 2018
In [256]: a = ['(0.0 | 0.0 | 0.0)', '(0.0 | 0.0 | 0.1)'] # strings
     ...: b = [0.0, 0.1] # floats
     ...: c = [0.0, 0.2] # floats
     ...: d = [0.0, 0.3] # floats
     ...: e = [0.0, 0.4] # floats
     ...: 
     ...: 

In [267]: dt = np.dtype([('f1', 'U20'), ('f2', np.float), ('f3', np.float), ('f4
     ...: ', np.float), ('f5', np.float)])

Структурированный массив должен инициализироваться со списком кортежей:

In [271]: [x for x in zip(a,b,c,d,e)]
Out[271]: 
[('(0.0 | 0.0 | 0.0)', 0.0, 0.0, 0.0, 0.0),
 ('(0.0 | 0.0 | 0.1)', 0.1, 0.2, 0.3, 0.4)]

In [273]: np.array([x for x in zip(a,b,c,d,e)],dtype=dt)
Out[273]: 
array([('(0.0 | 0.0 | 0.0)', 0. , 0. , 0. , 0. ),
       ('(0.0 | 0.0 | 0.1)', 0.1, 0.2, 0.3, 0.4)],
      dtype=[('f1', '<U20'), ('f2', '<f8'), ('f3', '<f8'), ('f4', '<f8'), ('f5', '<f8')])

Или заполненное поле по полю:

In [268]: arr = np.empty(2, dtype=dt)
In [269]: for n, x in zip(arr.dtype.names, [a,b,c,d,e]):
     ...:     arr[n] = np.array(x)
     ...:     
In [270]: arr
Out[270]: 
array([('(0.0 | 0.0 | 0.0)', 0. , 0. , 0. , 0. ),
       ('(0.0 | 0.0 | 0.1)', 0.1, 0.2, 0.3, 0.4)],
      dtype=[('f1', '<U20'), ('f2', '<f8'), ('f3', '<f8'), ('f4', '<f8'), ('f5', '<f8')])

Доступ к такому массиву можно получить по полюимя или номер записи:

In [274]: arr['f1']
Out[274]: array(['(0.0 | 0.0 | 0.0)', '(0.0 | 0.0 | 0.1)'], dtype='<U20')
In [276]: arr['f3']
Out[276]: array([0. , 0.2])
In [277]: arr[0]
Out[277]: ('(0.0 | 0.0 | 0.0)', 0., 0., 0., 0.)

Это массив 1d, а не 2d.

Другой вариант - массив типа dtype:

In [278]: np.array([a,b,c,d,e], dtype=object)
Out[278]: 
array([['(0.0 | 0.0 | 0.0)', '(0.0 | 0.0 | 0.1)'],
       [0.0, 0.1],
       [0.0, 0.2],
       [0.0, 0.3],
       [0.0, 0.4]], dtype=object)
In [279]: _.shape
Out[279]: (5, 2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...