Найти значение для даты до даты и все значения для дат после в pandas и найти функцию для вычисления интеграла - PullRequest
1 голос
/ 25 апреля 2019

У меня есть два фрейма данных: один - таблица с датой для какого-либо события (table_event), а второй - таблица со значением для нескольких дат (table_values).Я хотел бы создать третий фрейм данных (table_all_dates), который объединяет дату событий, значение и дату до события в table_event и все даты и значения после события в table_event.

После этого яЯ хочу связать, используя линейную регрессию, все события по строкам, чтобы я мог найти интеграл.Я могу сделать это вручную, но я не знаю, как сделать это более полезным и быстрым способом.

import pandas as pd
import numpy as np

table_values = pd.DataFrame({'id': ['A', 'B'],
                             'date1': ['2014/05/05', '2014/05/05'], 'value1': [1, 5],
                             'date2': ['2014/05/16', '2014/05/16'], 'value2': [8, 7], 
                             'date3': ['2014/07/08', '2014/07/08'], 'value3': [np.nan, 2],
                             'date4': ['2014/07/15', '2014/07/15'], 'value4': [7, 6],
                             'date5': ['2014/07/18', '2014/07/18'], 'value5': [3, 1]
                            })

table_event = pd.DataFrame({'id': ['A', 'B'], 'date_event': ['2014/06/01', '2014/05/10']})


table_all_dates = pd.DataFrame({'id': ['A', 'B'], 
                                'date_event': ['2014/06/01', '2014/05/10'],

                                'date_before_event' : ['2014/05/16','2014/05/05'], 
                                'value_before_event' : [8,5],

                                'first_date_after_event' : ['2014/07/15','2014/05/16'],
                                'first_value_after_event' : [7,7],

                                'second_date_after_event' : ['2014/07/18','2014/07/08'],
                                'second_value_after_event' : [3,2],

                                'third_date_after_event' : ['null','2014/07/15'],
                                'third_value_after_event' : [np.nan,6],

                                'fourth_date_after_event' : ['null','2014/07/18'],
                                'fourth_value_after_event' : [np.nan,1]
                               })


(table_all_dates ['value_before_event']+table_all_dates ['first_value_after_event'])/2*(table_all_dates ['first_date_after_event']-table_all_dates ['date_before_event'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...