Почему «Параметр сокращения сложности затрат» может быть «-Inf» в древовидной модели в R? - PullRequest
0 голосов
/ 04 мая 2020
library(tree)
?prune.misclass

data(fgl, package="MASS")
fgl.tr <- tree(type ~ ., fgl)
fgl.cv <- cv.tree(fgl.tr,, prune.tree)
fgl.cv

$size
 [1] 20 19 18 17 16 15 14 13 12 11 10  9  8  5  4  3  2  1

$dev
 [1] 591.7790 576.7895 576.7895 562.6111 533.0976 539.2956 539.8177 540.1762 539.8207 493.4218 497.7524 497.7524 445.5447 451.0321
[15] 456.8920 499.8430 498.1039 652.0590

$k
 [1]       -Inf   6.765927   6.771674   8.099535   8.940479   9.751469   9.873409   9.994950  10.356555  13.077082  16.041350
[12]  16.132081  18.672227  22.627954  38.229167  50.117941  55.081551 166.958846

$method
[1] "deviance"

attr(,"class")
[1] "prune"         "tree.sequence"

Согласно справочному документу, "k" равно

значению параметра сокращения стоимости

Я нашел определение Cost- Обрезка сложности на http://mlwiki.org/index.php/Cost-Complexity_Pruning#Choosing_ .24,5Calpha.24 . Кажется, что «k» в коде играет ту же роль, что и «параметр регуляризации». Но почему это может быть "-Inf" (см. Первый элемент в fgl.cv $ k)? Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...