Я довольно новичок в программировании в целом и только что сделал некоторые модели в scikit. Я знаю, что могу получить RO C или точность на тестовом наборе, но мне любопытно два вопроса. Как ввести новые зависимые переменные в модель?
Я выполнил генерацию некоторых функций, и мне, вероятно, потребуется добавить новые данные в исходный фрейм данных. После того, как он будет преобразован в функции, он будет масштабироваться и использоваться для обучения / тестирования. Последнее мне не нужно. Я просто хочу иметь ввод / вывод от модели.
Спасибо! Может быть, я не очень конкретен c, поэтому я хотел бы ответить на ваши вопросы.
О моем образовательном проекте: у нас большое количество музыкальных c потоков // Цель: предсказать успех художник
Я создал несколько функций для каждого художника, а также использовал PCA для географических данных. Результирующий DataFrame является зависимой фиктивной переменной (успешной / неудачной) и сгенерированными функциями. После того, как я подгоню дерево решений для начала.