замаскированные массивы с ошибкой - PullRequest
1 голос
/ 19 апреля 2011

Я ввожу файл, используя genfromtxt, и некоторые значения отсутствуют, поэтому я создаю замаскированный массив.Когда я пытаюсь проиндексировать некоторые значения записей массива, я получаю сообщение об ошибке, которое не могу понять.Любая помощь будет высоко оценен.Благодарю.--Alex

import csv
import datetime
import time
import numpy as np
import numpy.lib.recfunctions as rf
import pprint
import numpy.ma as ma

date_converter = lambda x: datetime.date(int(x[-4:]), int(x[3:5]), int(x[:2]))
input_file = np.genfromtxt("../data/test.csv", usemask=True, converters={0:date_converter}, dtype="O4, i8, i8, i8, i8", names="date, firm, val1, val2, val3", delimiter=",", skip_header=1)

Генерирует:

masked_array(data = [(datetime.date(2001, 3, 1), 1L, --, 14L, 15L)
 (datetime.date(2001, 2, 1), 1L, 10L, 11L, 12L)
 (datetime.date(2001, 5, 1), 1L, 19L, 20L, 21L)
 (datetime.date(2001, 4, 1), 1L, 16L, --, 18L)],
             mask = [(False, False, True, False, False) (False, False, False, False, False)
 (False, False, False, False, False) (False, False, False, True, False)],
       fill_value = ('?', 999999L, 999999L, 999999L, 999999L),
            dtype = [('date', '|O4'), ('firm', '<i8'), ('val1', '<i8'), ('val2', '<i8'), ('val3', '<i8')])

Когда я запускаю input_file[0], я получаю следующую ошибку:

Traceback (most recent call last):
  File "<pyshell#278>", line 1, in <module>
    input_file[0]
  File "C:\Python27\lib\site-packages\numpy\ma\core.py", line 2956, in __getitem__
    dout = mvoid(dout, mask=mask)
  File "C:\Python27\lib\site-packages\numpy\ma\core.py", line 5529, in __new__
    _data[()] = data
ValueError: Setting void-array with object members using buffer.

1 Ответ

0 голосов
/ 04 октября 2013

input_file [0] - неправильный способ доступа к данным в замаскированном массиве (см. документация )

например:

>>> import numpy as np
>>> arr = np.ma.ones(3, dtype=[('c1', np.int),('c2', np.int)])
>>> arr.mask[0][1] = True
>>> arr.data[0][0] = 2              
>>> np.ma.getdata(arr)[1][0] = 3    
>>> arr.data[2][0] = 4       
>>> print(arr)
   [(2, --) (3, 1) (4, 1)]
...