Значение выборок в формате набора данных Libsvm (в частности, Mnist) - PullRequest
3 голосов
/ 18 сентября 2011

Я скачал набор данных Mnist со страницы набора данных Libsvm .Все образцы похожи на следующие:

5 153:3 154:18 155:18 156:18 157:126 ...

Кто-нибудь знает, что это значит?5 это метка класса, но что такое, например, пара 153:3?Также я не смог найти значение на собственной веб-странице mnist .

1 Ответ

7 голосов
/ 19 сентября 2011

Так libsvm кодирует (разреженные) векторы. Как вы сказали, 5 является меткой, а следующие пары i:v говорят, что i -ая запись вектора - v. Таким образом, вы бы закодировали 3-мерный вектор (a, b, c) как

1:a 2:b 3:c

Что неэффективно для плотных векторов, но хороший и устоявшийся формат для разреженных данных. Поскольку это простой текст, пространство для хранения не является оптимальным, но достаточно для большинства приложений. В то время как файлы легко писать и читать.

...