Случайные леса - это не что иное, как упаковка , применяемая к деревьям решений, и нам нужны случайные числа для генерации случайных выборок (выборок начальной загрузки), на которых установлены деревья.Но у нас здесь может быть проблема: каждый раз, когда вы генерируете набор случайных чисел, программа генерирует совершенно другой набор случайных чисел, который снова влияет на ваши выборки начальной загрузки и, в свою очередь, на деревья, которые подгоняются.Таким образом, чтобы контролировать стохастичность, участвующую в генерации случайных чисел, и каждый раз повторять один и тот же набор случайных чисел, мы используем случайное начальное число.И random_state
- это один параметр, который позволяет вам установить случайное начальное число для процесса генерации случайного числа в случайном лесу.
Одной из основных причин, по которым необходимо устанавливать случайное начальное число, является воспроизводимость эксперимента.Всегда лучше установить случайное начальное число и начать строить свою модель, чтобы каждый раз, когда вы строите модель с одними и теми же данными, вы получали одну и ту же модель.
Эта идея установки случайного начального числаЭтот параметр не только ограничен случайным лесом. Любой алгоритм, для которого требуется случайное число (нейронные сети, деревья решений и т. д.), будет иметь этот параметр.
Надеюсь, это поможет!