программа на python для экспорта numpy / списков в формате svmlight - PullRequest
5 голосов
/ 16 февраля 2012

Есть ли способ экспортировать массив python в легкий формат SVM?

Ответы [ 3 ]

6 голосов
/ 17 февраля 2012

Есть один в scikit-learn :

http://scikit -learn.org / стабильный / модули / полученные / sklearn.datasets.dump_svmlight_file.html

Это базовое решение, но оно работает как для пустых массивов, так и для рассеянных матриц.

5 голосов
/ 16 февраля 2012

Я написал этот совершенно неоптимизированный скрипт некоторое время назад, может быть, это поможет!Данные и метки должны быть в двух отдельных массивах.

def save_svmlight_data(data, labels, data_filename, data_folder = ''):
    file = open(data_folder+data_filename,'w')

    for i,x in enumerate(data):
        indexes = x.nonzero()[0]
        values = x[indexes]

        label = '%i'%(labels[i])
        pairs = ['%i:%f'%(indexes[i]+1,values[i]) for i in xrange(len(indexes))]

        sep_line = [label]
        sep_line.extend(pairs)
        sep_line.append('\n')

        line = ' '.join(sep_line)

        file.write(line)
1 голос
/ 16 февраля 2012

Модуль svmlight-loader может загружать файл svmlight в массив numpy. Я не думаю, что что-то существует для другого направления, но модуль, вероятно, является хорошей отправной точкой для расширения его функциональности.

...