Как указать имя функции для sklearn dump_svmlight_file в Python? - PullRequest
0 голосов
/ 17 января 2019

Docs: https://scikit -learn.org / стабильный / модули / полученные / sklearn.datasets.dump_svmlight_file.html

svmlight соответствует формату данных:

<target> <feature:value> <feature:value>

С данными:

a = [[1,2,3],[4,5,6]]
b = [8,9]

Выполнение команды:

dump_svmlight_file(a,b,'test.txt')

Выводит следующее:

8 0:1 1:2 2:3
9 0:4 1:5 2:6

Я хотел бы знать, если есть способ указать имя объекта, а не увеличивать его с 0, я бы хотел получить что-то вроде следующего:

1 10:5 50:15 100:50
0 10:15 25:5 75:15
1 20:5 40:5 60:5

Имеет ли команда dump_svmlight_file такую ​​возможность?

1 Ответ

0 голосов
/ 18 января 2019

Нет. dump_svmlight_file не имеет встроенной опции. Исходный код

Вы можете просто указать, должны ли имена элементов начинаться с 0 или 1, используя параметр zero_based. Документация

Я бы посоветовал вам не пытаться создавать дамп файла с фактическими именами объектов, что излишне увеличит размер файла. Вместо этого выберите ваши имена элементов как отдельные и затем присоединитесь к ним.

...