Я хотел бы реализовать небольшой проект, чтобы классифицировать набор документов (file.txt) по числу категорий, а затем протестировать новые документы в соответствии с тем, используя SVM в c ++.
Я много искал это, но тем не менее, я не получил полного понимания того, что мне нужно делать! Я слышал о библиотеке LIBLINEAR, но не знаю, как ее использовать, если я буду использовать TF-IDF, нужно ли иметь вектор для каждого класса? или один вектор для всех классов? Как проверить новый документ с помощью TF-IDF? Я действительно смущен!