Отстающие переменные результата, чтобы найти корреляцию с маркетинговыми инвестициями - PullRequest
0 голосов
/ 13 апреля 2019

У меня есть набор данных, который содержит ежедневное количество посещений веб-сайта, регистрации и маркетинговые инвестиции.Компания делает рекламные и маркетинговые инвестиции для улучшения посещений и регистрации.Я хочу знать, влияют ли сегодня маркетинговые инвестиции на 3-дневный лаг посещения и результаты регистраций.! (https://imgur.com/f6N6Cop)

Я использую Python и pandas для решения проблемы. Я уже пробовал некоторые корреляции панд, но это дает только корреляцию без задержек по времени. Затем я попытался отложить некоторую ценность для посещений и регистрацийот 1 до 3 дней, чтобы найти корреляцию между сегодняшними инвестициями и запаздывающими посещениями и регистрациями, но я не знаю, является ли это лучшим подходом к решению проблемы.

df['VISITS_+1'] = df['VISITS'].shift(-1)
df['VISITS_+2'] = df['VISITS'].shift(-2)
df['VISITS_+3'] = df['VISITS'].shift(-3)
df['REGISTRATIONS+1'] = df['REGISTRATIONS'].shift(-1)
df['REGISTRATIONS+2'] = df['REGISTRATIONS'].shift(-2)
df['REGISTRATIONS+3'] = df['REGISTRATIONS'].shift(-3)

corr = df.corr(method='pearson')
f, ax = plt.subplots(figsize=(12, 9))
sns.heatmap(corr, 
            xticklabels=corr.columns.values,
            yticklabels=corr.columns.values, vmax=.8, square=True)

corr.style.background_gradient()
corr.style.background_gradient().set_precision(3)

Я ожидаю подать заявкулучшие методы, которые позволяют мне сделать вывод, существует ли корреляция, показывающая, являются ли посещения и регистрации, которые мы получаем в течение 1-3 дней, результатом прошлых краткосрочных маркетинговых инвестиций.

...