Импорт scikit-learn вызывает ошибку MemoryError в csv.DictReader - PullRequest
0 голосов
/ 25 мая 2020

У меня есть сценарий python, в котором я читаю большой файл .csv, используя DictReader пакета csv как таковой:

def read_input_file(input_file):
    print('reading', input_file)
    with open(input_file, 'r') as csvfile:
        reader = csv.DictReader(csvfile)
        records = {}
        for row in reader:
            record_id = row['id']
            if record_id in records:
                records[record_id].append(row)
            else:
                records[record_id] = [row]
    return records

Чтение данных работает нормально, пока я не добавлю следующий импорт: from sklearn.cluster import MeanShift. Когда этот импорт включен в сценарий, функция чтения csv завершается ошибкой с ошибкой MemoryError, хотя я не использую какой-либо sklearn или даже объект или функции numpy внутри считывающего logi c. Есть идеи, почему это происходит?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...