Реальные наборы данных scikit учат ошибку загрузки - PullRequest
0 голосов
/ 02 апреля 2019

Я пытаюсь протестировать наборы данных реального мира из scikit-learn в мини-пакетной k-средней реализации (с использованием python), но это дает мне ошибку! [Я не изменил ничего в коде, только имя набора данных]код работал правильно, используя игрушечный набор данных

Примечание: fetch_olivetti_faces отлично работает с тем же кодом, но не с любым другим набором данных

from sklearn.datasets import fetch_20newsgroups_vectorized
boston =fetch_20newsgroups_vectorized()

я получил эту ошибку

Traceback (most recent call last):
  File "C:/Users/User/PycharmProjects/untitled/venv/Scripts/mbkm.py", line 18, in <module>
    boston =fetch_20newsgroups_vectorized()
  File "C:\Users\User\PycharmProjects\untitled\venv\lib\site-packages\sklearn\datasets\twenty_newsgroups.py", line 406, in fetch_20newsgroups_vectorized
    X_train, X_test = _joblib.load(target_file)
  File "C:\Users\User\PycharmProjects\untitled\venv\lib\site-packages\sklearn\externals\joblib\numpy_pickle.py", line 598, in load
    obj = _unpickle(fobj, filename, mmap_mode)
  File "C:\Users\User\PycharmProjects\untitled\venv\lib\site-packages\sklearn\externals\joblib\numpy_pickle.py", line 526, in _unpickle
    obj = unpickler.load()
.
.
    raise ValueError(msg % (error_template, size, len(data)))
ValueError: EOF: reading array data, expected 45260 bytes got 23049
...