Как прогнозировать с помощью функции с различными типами данных? - PullRequest
0 голосов
/ 19 сентября 2019

У меня есть набор данных, таких как (Дата, Количество, Категория, Страна, Штат, Цена за единицу, Чистый объем продаж, Общая прибыль)

Можете ли вы, ребята, помочь мне с кодом Python, как я могу использовать всеФункция для прогнозирования «Общая прибыль».Функции имеют разные типы данных.Я перепробовал много подходов, но не повезло.

Спасибо,

Ответы [ 2 ]

0 голосов
/ 19 сентября 2019

Прежде всего вам необходимо выполнить инжиниринг данных для независимых функций (Дата, Количество, Категория, Страна, Штат, Цена за единицу, Чистые продажи), затем вы можете применить модель машинного обучения для прогнозирования целевой переменной (Общая прибыль).

Эта статья может помочь вам, так как в ней есть четкое описание того, что такое EDA и как можно обрабатывать различные переменные
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

После того, как вы закончили разработку данных, вы применяете регрессионные модели (линейный, случайный лес или свм ...)

0 голосов
/ 19 сентября 2019

Тип проблемы машинного обучения (ML), которую вы пытаетесь решить, - это проблема ML-регрессии.Есть много моделей, которые можно попробовать.

Я бы посоветовал вам попробовать регрессор Random Forest.Посмотрите на этот средний пост: Руководство для начинающих по регрессии случайных лесов .

Ваш основной друг в таких случаях будет scikit-learn библиотека.Из этого микро-курса по машинному обучению вы получите много пользы: Среднее машинное обучение .

Возможно, вы захотите взглянуть на некоторые курсы ML по Udemy и Coursera .

Надеюсь, это поможет.

...