Я пытаюсь предсказать продолжительность утечки газовых труб.Я использовал 15 функций, наиболее важной из которых является «год монтажа труб».Последние данные об утечках, которые у меня есть, касаются утечек, которые произошли в 2017 году, и что труба была установлена в 2009 году. Я знаю, что обычные модели ML, которые я построил, не смогут хорошо предсказать продолжительность утечки для труб, которые былиустановлен после 2009 года. Причина, по которой я это говорю, заключается в том, что я сначала отсортировал данные на основе их «года установки», а затем провел разделение теста на поезда, чтобы посмотреть, как оно работает при прогнозировании набора тестовых данных, я получил% 93 R в квадрате, но когда я повернулсяфункция тасования отключена при разделении теста поезда (что означает, что в отличие от обычного разделения теста поезда, в котором подмножества выбираются случайным образом, данные будут в порядке первой тренировки% 80 и последней проверки% 20), чтобы увидеть, может ли она предсказатьтрубы, которые их «год установки» не было в обучении модели, я получил только% 30 R в квадрате.Я знаю, что «год установки» - довольно важная особенность, и модель ML не может предсказать трубы, которые их «год установки» не обучали в модели.
Я также использую регрессии выживания также поверхнормальные модели ML. Я не уверен, что у меня будет такая же проблема в модели COX PH и других многомерных моделях выживания или нет.Может ли COX PH прогнозировать коэффициент опасности и функцию выживания для труб, которые были установлены после 2009 года?