Загрузка нескольких файлов с помощью load_svmlight_files и sklearn - Проблема - PullRequest
0 голосов
/ 04 июня 2019

У меня проблемы с загрузкой более одного файла с помощью функции sk_learns load_svmlight_files. Согласно документации, он может загружать несколько файлов, которые находятся в списке (если я правильно понял) Все файлы находятся в одной папке, поэтому достаточно просто имен. Но когда я загружаю и печатаю данные, они проходят отлично, но загружает только первый файл.

См. Несколько рабочий код ниже

from sklearn.externals import joblib
from joblib import Memory

l_files = ["labeledBowtrain.feat", "labeledBowtest.feat"]
mem = Memory("./anaconda3/pkgs/cache")

@mem.cache
def get_data():
    data = load_svmlight_files(l_files)
    return data[0], data[1]

X, y = get_data()

(print(X))

Он должен иметь 50000 строк с разреженной матрицей (так как 2 файла имеют по 25000 строк в каждом), но он имеет только 25000.

Спасибо заранее! :)

...