R-C50: определение minCases в C5.0Control - PullRequest
0 голосов
/ 06 ноября 2018

Параметр minCases функции C5.0Control в пакете C50 R определяется как:

целое число для наименьшего числа выборок, которое должно быть помещено как минимум в два из разбиений.

Как это реализовано? Я предполагаю, что split в этом контексте относится к узлам, полученным в результате операции разделения. minCases, по-видимому, не представляют наименьшее количество дел, которые должны быть помещены хотя бы в один узел, как я и ожидал.

Я попытался найти реализацию в исходном коде C . Кажется, переменная minCases определена в extern.h в строке 33:

extern CaseCount MINITEMS, LEAFRATIO;

Используется, например, в prune.c , строки 249 и 250:

if (BranchCases [v]

Что на самом деле делает minCases?

...