Особенности разработки в маркетинговой аналитике в Python - PullRequest
0 голосов
/ 02 октября 2019

Feature Engineering для маркетинговой аналитики в Python

У меня есть данные с переменными offer_id (например, 1,2,5,10 ....) и product_id (например, 6178,4184,5124, ...). offer_id может применяться к нескольким product_id.

. Как создать отдельную переменную для каждого product_id, чтобы, если к ней применима конкретная offer_id, тогда переменная product_id получала значение 1в противном случае он получает значение 0.

Отдельные переменные для каждого product_id должны иметь значение 0 или 1. Значение 0 для обозначения offer_id не применимо, а значение 1 для обозначения применимости offer_id.

1 Ответ

0 голосов
/ 02 октября 2019

Вы можете создавать новые столбцы, сопоставляя простые функции для каждого типа предложения, чтобы проверить значение в столбце offer_id. (если значение == 5 возвращает 1, иначе возвращает 0 и т. д.).

Аналогично, вы можете использовать np.where для достижения того же самого. Т.е. создать новые столбцы, выполнив условные проверки столбца offer_id.

например: df['is_5'] = np.where(df.offer_id == 5, 1, 0)

(т. Е. Если offer_id == 5, вернуть 1, иначе вернуть 0).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...