У меня есть данные за 3 года о международных импортерах, закупающих сырье из разных стран. Данные состоят из:
Код товара, Страна покупателя, Имя покупателя, Порт назначения, Страна продавца, Имя продавца, Порт отправления, единица измерения, Стоимость (USD), Цена за единицу.
Я хотел бы предсказать, будет ли конкретный покупатель совершать покупку на следующей неделе. Логистическая регрессия стала естественным выбором для этого. Однако, глядя на данные, у которых есть только положительные результаты, я должен сбалансировать данные для того, чтобы иметь и положительные и отрицательные результаты?
Так что, если я смотрю на еженедельный прогноз, должен ли я агрегировать все транзакции этого покупателя за неделю и добавлять строку с отрицательным результатом в каждую неделю, в которой не было транзакции?