Извините, я знаю, что это очень простой вопрос c, но, поскольку я все еще новичок в машинном обучении, определение модели, которая лучше всего подходит для моей задачи, все еще смущает меня, в последнее время я использовал линейный регрессионная модель (в результате чего r2_score
настолько низок), и пользователь упомянул, что я мог бы использовать определенную модель в соответствии с кривой графика моих данных, и когда я вижу, что другой кодер использует случайный регрессор леса (в результате чего r2_score
30% лучше чем модель линейной регрессии), и я не знаю, как, черт возьми, он / она знает лучшую модель, так как он / она не упоминает об этом. Я имею в виду, что на большинстве сайтов, которые я читаю, они помещают данные в некоторые модели, которые, по их мнению, лучше всего подойдут для этой проблемы (пример: для проблемы регрессии модели могут использовать линейную регрессию или случайный лесной регрессор), но на некоторых сайтах и в некоторых Сначала люди сказали, что нам нужно построить данные, чтобы мы могли предсказать, какая именно модель подходит лучше всего. Я действительно не знаю, какую часть данных я должен построить? Я думал, что использование seaborn pairplot
даст мне понимание формы кривой, но я сомневаюсь, что это правильный путь, что я должен на самом деле построить? только сам лейбл или сам функционал или оба? и как я могу получить представление о кривой, чтобы узнать возможную лучшую модель после этого?