У меня есть два фрейма данных: один - таблица с датой для какого-либо события (table_event), а второй - таблица со значением для нескольких дат (table_values).Я хотел бы создать третий фрейм данных (table_all_dates), который объединяет дату событий, значение и дату до события в table_event и все даты и значения после события в table_event.
После этого яЯ хочу связать, используя линейную регрессию, все события по строкам, чтобы я мог найти интеграл.Я могу сделать это вручную, но я не знаю, как сделать это более полезным и быстрым способом.
import pandas as pd
import numpy as np
table_values = pd.DataFrame({'id': ['A', 'B'],
'date1': ['2014/05/05', '2014/05/05'], 'value1': [1, 5],
'date2': ['2014/05/16', '2014/05/16'], 'value2': [8, 7],
'date3': ['2014/07/08', '2014/07/08'], 'value3': [np.nan, 2],
'date4': ['2014/07/15', '2014/07/15'], 'value4': [7, 6],
'date5': ['2014/07/18', '2014/07/18'], 'value5': [3, 1]
})
table_event = pd.DataFrame({'id': ['A', 'B'], 'date_event': ['2014/06/01', '2014/05/10']})
table_all_dates = pd.DataFrame({'id': ['A', 'B'],
'date_event': ['2014/06/01', '2014/05/10'],
'date_before_event' : ['2014/05/16','2014/05/05'],
'value_before_event' : [8,5],
'first_date_after_event' : ['2014/07/15','2014/05/16'],
'first_value_after_event' : [7,7],
'second_date_after_event' : ['2014/07/18','2014/07/08'],
'second_value_after_event' : [3,2],
'third_date_after_event' : ['null','2014/07/15'],
'third_value_after_event' : [np.nan,6],
'fourth_date_after_event' : ['null','2014/07/18'],
'fourth_value_after_event' : [np.nan,1]
})
(table_all_dates ['value_before_event']+table_all_dates ['first_value_after_event'])/2*(table_all_dates ['first_date_after_event']-table_all_dates ['date_before_event'])