Я построил RandomForest (RF) с пакетом sklearn.
Моя проблема в том, что я обучил РЧ с одинаковыми образцами с разными группами функций.
Например, есть 10 000 образцов, и я получил данные из разных лабораторий.
FR1 обучен с данными из Lab1
FR2 обучается с данными из Lab2
...
FR5 обучается с данными из Lab5
Количество функций в каждой лаборатории составляет 4000, поэтому размер данных в каждой лаборатории составляет 10 000 x 4000
Вместо слияния всех данных я бы хотел обучить RF и принять окончательное решение большинством голосов.
Большинство голосов не только на основе лабораторий, но с учетом всех голосов в отдельных лабораториях.
Например, все модели произвели 100 деревьев, тогда я хотел бы принять окончательное решение из 100 * (5 лабораторных работ) = 500 деревьев. Не только большинством голосов лабораторий, но и большинством голосов от всех деревьев, полученных из отдельных лабораторий.
Не могли бы вы помочь мне, как я могу решить эту проблему?
Спасибо.