Логистическая регрессия для прогнозирования покупки - PullRequest
0 голосов
/ 13 января 2019

У меня есть данные за 3 года о международных импортерах, закупающих сырье из разных стран. Данные состоят из:

Код товара, Страна покупателя, Имя покупателя, Порт назначения, Страна продавца, Имя продавца, Порт отправления, единица измерения, Стоимость (USD), Цена за единицу.

Я хотел бы предсказать, будет ли конкретный покупатель совершать покупку на следующей неделе. Логистическая регрессия стала естественным выбором для этого. Однако, глядя на данные, у которых есть только положительные результаты, я должен сбалансировать данные для того, чтобы иметь и положительные и отрицательные результаты?

Так что, если я смотрю на еженедельный прогноз, должен ли я агрегировать все транзакции этого покупателя за неделю и добавлять строку с отрицательным результатом в каждую неделю, в которой не было транзакции?

1 Ответ

0 голосов
/ 21 января 2019

Сейчас это очень абстрактно, и поэтому могут быть даны только абстрактные ответы.

Практически любая двоичная модель требует, чтобы оба класса присутствовали в наборе обучающих данных, поэтому вам нужно собрать больше данных, чтобы они содержали оба класса (или разделить их далее, чтобы сделать более мелкие интервалы, которые будут содержать оба класса, если это то, что Вы намекаете на).

Перекрестная проверка выполняется одновременно с построением модели для оценки производительности модели.

...