Я пытаюсь решить простую проблему классификации.
Проблема:
У меня есть набор текста, и я должен классифицировать его на основе содержимого.
Решение с использованиемMahout:
Я понял, что мне нужно преобразовать входные данные в файл последовательности, чтобы сгенерировать модель.Да, я смог сделать это.Теперь, как мне классифицировать мои тестовые данные?Пример 20News только проверяет правильность.Но я хочу провести фактическую классификацию.
Я не уверен, нужно ли мне писать код или использовать некоторые существующие классы, доступные для классификации тестового набора .?