В настоящее время я работаю над наборами данных KDD CUP 99 и NSL-KDD (наборы данных для обнаружения вторжений). Они делятся на обучающие и тестовые наборы, однако, когда я прохожу наборы, они имеют разные типы атак (метки данных).
Это нормально?
Точность прогнозов на тестовом наборе будет снижена из-за классов, которые мой классификатор не смог правильно классифицировать, поскольку он никогда не обучался на них.
Спасибо!