Применение алгоритмов машинного обучения в файлах данных формата .libsvm - PullRequest
0 голосов
/ 22 сентября 2018

В настоящее время я работаю с наборами данных в формате .libsvm и не могу использовать разные алгоритмы машинного обучения, такие как kNN, SVM, Случайный лес в этих наборах данных.

Их легко применить к формату .csv, ноэтот метод не работает с файлом .libsvm.

Пожалуйста, объясните метод.

1 Ответ

0 голосов
/ 22 сентября 2018

Формат LIBSVM открыто стандартизирован и, возможно, лучше анализировать / использовать, чем формат CSV.Базовый формат можно увидеть здесь .

Но вам не нужно делать это самостоятельно.

Вы можете прочитать их с помощью sklearn иэто load_svmlight_file :

Загрузка наборов данных в формате svmlight / libsvm в разреженную матрицу CSR

Но ознакомьтесь с разреженными матрицами, хотя,при использовании sklearn большинство вещей будет работать без заботы о плотности и разреженности.

Я не знаю много о фоне / развитии этого формата по сравнению с форматом svmlight, но в документах sklearn говорится, что этоТо же самое, и я могу подтвердить, что, по опыту, загружая все libsvm наборы данных с помощью вышеуказанной функции.

...