Я делаю анализ причинно-следственных связей в Python. Этот вид анализа помогает измерить воздействие в группе лечения после вмешательства по сравнению с контрольной группой (A / B-тестирование). Я читал отсюда литературу: https://www.analytics-link.com/post/2017/11/03/causal-impact-analysis-in-r-and-now-python
Допустим, мои данные имеют следующий формат:
введите описание изображения здесь
Следующий код работает отлично:
from causalimpact import CausalImpact
cut_off_point = 12
pre_period = [0,cut_off_point-1]
post_period = [cut_off_point,data.shape[0]-1]
impact = CausalImpact(data, pre_period, post_period)
impact.run()
impact.plot()
Однако, если я добавлю дополнительный столбец Date и попытаюсь разделить группы обработки и управления по дате, я получаю error
Скажем, теперь я определяю периоды до и после по дате следующим образом:
pre_period = ['2020-04-27','2020-06-29']
post_period = ['2020-07-06','2020-07-27']
impact = CausalImpact(data, pre_period, post_period)
impact.run()
impact.plot()
Я получаю сообщение об ошибке:
ConversionError: Failed to convert value(s) to axis units: '2020-06-29'
Я преобразовал дату для индексации, но по-прежнему появляется ошибка.
Кто-нибудь может помочь. Похоже, что в Интернете имеется ограниченная литература по этой библиотеке и ее использованию в A / B-тестировании. Большое спасибо за вашу помощь!