Суммируйте значение словаря на основе разницы между двумя столбцами в кадре данных и разделите первый столбец на два - Python - PullRequest
0 голосов
/ 04 апреля 2020

У меня есть фрейм данных и словарь

 Start_date     End_Date

1 2019-01-16    2019-05-28  
2 2018-06-05    2018-07-31  
3 2019-02-11    2019-04-14  
{'HDD': {'2015-01': 477.6,
  '2016-01': 429.0,
  '2017-01': 593.8,
  '2018-01': 372.1,
  '2019-01': 502.8,
  '2015-02': 457.4,
  '2016-02': 377.6,
  '2017-02': 369.8,
  '2018-02': 469.8,
  '2019-02': 395.5,
  '2015-03': 325.2,
  '2016-03': 370.8,
  '2017-03': 266.1,
  '2018-03': 392.9,
  '2019-03': 297.3,
  '2015-05': 24.2,
  '2016-05': 97.4,
  '2017-05': 88.5,
  '2018-05': 41.4,
  '2019-05': 118.1,
  '2015-06': 0.0,
  '2016-06': 0.0,
  '2017-06': 0.0,}}

В выходной ящик помещается новое значение столбца, которое является суммой значения словаря (считая месяцы между начальной и конечной датой).

 Start_date     End_Date    Value

1 2019-01-16    2019-05-28  760
2 2018-06-05    2018-07-31  803
3 2019-02-11    2019-04-14  200

Проблема здесь -> Я хочу разделить на 2 значение жесткого диска месяца start_date, если день start_date превышает 15, и разделить значение end_date, если день of end_date ниже 28. Значение между двумя датами не будет делиться на 2, только значение месяца start / end_date. Мой код работает для части, он может разделить end_date на 2, но для start_date он принимает все значение жесткого диска.

from datetime import datetime, date, time
import calendar
def get_sum_values(start_date, end_date, dictionary,start_middle=15, end_middle=28):
    tot= 0
    j = 1
    i=1
    difference = (end_date.year - start_date.year) * 12 + (end_date.month - start_date.month)
    for key in dictionary['HDD'].keys():
        if datetime.strptime(key, '%Y-%m')>=start_date and datetime.strptime(key, '%Y-%m')<=end_date:
            if (i==0 and start_date.day >= start_middle ) or (j==end_date.month and end_date.day<=end_middle):
                tot+=dictionary['HDD'][key]/2
            else:
                tot+=dictionary['HDD'][key]
        #if start_date.dt.day <= start_middle or end_date.dt.day>=end_middle:
                #-dictionary['HDD'][key][end_date]/2
            i+=1
            j+=1
    return tot

gaz['HDD'] = gaz.apply(lambda row: get_sum_values(row['Start_Date'], row['End_Date'],hdd_dict), axis=1)

Надеюсь, это понятно. Большое спасибо за вашу помощь:).

1 Ответ

0 голосов
/ 04 апреля 2020

Если ваши данные не слишком велики, вы можете использовать для этого apply:

lookup = pd.DataFrame(d)
lookup.index=pd.to_datetime(lookup.index).to_period('M')

df['Value'] = df.apply(lambda x: lookup.loc[x['Start_date']: x['End_Date'], 'HDD'].sum(), axis=1)

Вывод:

  Start_date   End_Date   Value
1 2019-01-16 2019-05-28  1313.7
2 2018-06-05 2018-07-31     0.0
3 2019-02-11 2019-04-14   692.8
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...