описание формата файла SVM - PullRequest
0 голосов
/ 15 мая 2018

У меня есть набор данных в формате SVM.Это просто одна строка:

-1 4:0.0788382 5:0.124138 6:0.117647 11:0.428571 16:0.1 17:0.749633 18:0.843029 19:0.197344 21:0.142856 22:0.142857 23:0.142857 28:1 33:0.0555556 41:0.1 54:1 56:1 64:1 70:1 72:1 74:1 76:1 82:1 84:1 86:1 88:1 90:1 92:1 94:1 96:1 1

Может ли кто-нибудь дать описание этого файла, пожалуйста?Как читать этот формат?Спасибо!

1 Ответ

0 голосов
/ 15 мая 2018

Это не относится только к SVM; это общий столбчатый формат. Первая запись (-1 в этом примере) является меткой для наблюдения. Другие записи являются парами feature_number : value записей.

В ваших данных наблюдениях метка (классификация) равна -1 (вероятно, "плохое событие"). Первые четыре функции (0-3) не имеют значения. Особенности 4-6 имеют указанные значения; 7-10 пропали без вести. Это продолжается до конца строки. Я не уверен, что означает конечное значение 1; этот синтаксис является новым для меня.

...