Я пытаюсь классифицировать небольшой набор данных (около 10000 записей) на два класса. Я использовал различные методы, такие как DT, наивный байесовский и k-nn классификатор. Теперь я хотел бы установить результаты одного из классификаторов, которые являются моей базой, и выполнить статистическую проверку гипотез. Я не очень знаком с этой областью статистического тестирования, и мне интересно, как это сделать.
Я думал о том, чтобы установить классификатор DT в качестве моей базовой линии, но я не уверен, как выполнить т -тест (или аналогичный) на данных. Входной набор данных имеет 192 атрибута. Должен ли я использовать результаты классификации двух классификаторов и провести парный t-тест на них? Например, я мог бы взять результат из Наивного Байеса и выполнить парный t-тест с результатами DT (который является базовой линией). Это правильный подход?
Кроме того, меня смущает объяснение нулевой и альтернативной гипотезы. Может ли кто-нибудь дать представление о том, как исправить нулевую и альтернативную гипотезу.