Параметр minCases функции C5.0Control в пакете C50 R определяется как:
целое число для наименьшего числа выборок, которое должно быть помещено как минимум в два из разбиений.
Как это реализовано? Я предполагаю, что split в этом контексте относится к узлам, полученным в результате операции разделения. minCases, по-видимому, не представляют наименьшее количество дел, которые должны быть помещены хотя бы в один узел, как я и ожидал.
Я попытался найти реализацию в исходном коде C . Кажется, переменная minCases определена в extern.h в строке 33:
extern CaseCount MINITEMS, LEAFRATIO;
Используется, например, в prune.c , строки 249 и 250:
if (BranchCases [v]
Что на самом деле делает minCases?