Я новичок в Python и буду очень признателен за помощь.
Речь идет о логистической регрессии (машинное обучение). У меня нет проблем до обучения алгоритму.
Наборы данных следующие:
Кадр данных cost_train содержит целевую переменную0 и 1 двоичная классификация.
cost_train =..
(13900 observations)
cost_test =...
(5400 observations)
invoices_train =..
(6000000 observations)
invoices_test =...
(105000 observations)
Короче говоря, нет необходимости применять train_test_split. Моя первая идея состояла в том, чтобы объединить 3 других фрейма данных с фреймом данных cost_train, но после нескольких дней борьбы я понял, что он не сработает.
Я буду очень признателен за любые советы или решения.