Поддержка Vector Machine / K-ближайших соседей образцы кода - PullRequest
2 голосов
/ 30 апреля 2011

Я пытаюсь закодировать программу SVM или KNN для классификации текстовых документов. Я понимаю концепции обоих, но мне бы хотелось увидеть несколько хороших примеров кода, которые конкретно демонстрируют, как представлять текст / слова как векторы. Кто-нибудь знает хорошие учебники / статьи / лекции / что-нибудь с примерами кода? Даже код, который я мог бы пройти через себя, был бы хорош. Я лучше всех разбираюсь в ruby ​​и java, хотя я могу понять python, javascript, c ++. Я возьму примеры на любом языке, хотя на самом деле.

1 Ответ

0 голосов
/ 06 октября 2011

Это зависит от формата входного файла вашей библиотеки SVM.Например, формат файла libsvm требует, чтобы каждый объект был закодирован как целое число, и, кроме того, индексы объекта находятся в порядке возрастания.

Дополнительная информация здесь: http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#/Q3:_Data_preparation

...