Я думаю, что аргументация выглядит следующим образом: классификатор ZeroR просто присваивает каждое значение наиболее распространенному классу (как выясняется путем изучения обучающих данных). Это означает, что если ваши данные соответствуют 55% класса A, 10% класса B, 5% класса C и т. Д., То ZeroR получит право на 55%. Если ваши данные соответствуют 33% класса A, 31% класса B, 28% класса C и т. Д., То ZeroR получит право на 33%.
За исключением случайного выбора классов, это в значительной степени самый тупой классификатор, который вы можете получить, и поэтому вы можете измерить другие классификаторы по тому, насколько хорошо они справляются с этим минимальным уровнем производительности. Имея определенный набор данных, вы можете использовать ZeroR, чтобы узнать, какую минимальную производительность вы можете ожидать.