Создание нового столбца для поиска диапазона дат - PullRequest
1 голос
/ 06 апреля 2019

Я работаю над фреймом данных, который содержит дату. Я хочу создать новый столбец, чтобы классифицировать период даты в году. Это означает, что я буду принимать как каждые 2 месяца как диапазон. Но моя дата начала будет август. Таким образом,

Aug to Sep is 1,
Oct to Nov is 2,
Dec to Jan is 3,
Feb to Mar is 4 and
Apr to May is 5.

Пример даты следующий:

data =pd.DataFrame()
data ['Date'] = ['27-03-2019','08-10-2019','09-04-2019','09-08-2018']
data.period = pd.to_datetime(data['Date'])

Ожидаемый результат в виде диапазона в новом столбце будет следующим:

enter image description here

Может кто-нибудь посоветовать мне, как это сделать?

Большое спасибо

Zep.

Ответы [ 2 ]

3 голосов
/ 06 апреля 2019
import pandas as pd
df =pd.DataFrame()
df ['Date'] = ['27-03-2019','10-08-2019','04-09-2019','08-09-2018']
df.Date = pd.to_datetime(df['Date'])


month_range={8:1,9:1,10:2,11:2,12:3,1:3,2:4,3:4,4:5,5:5,6:6,7:6}

df['Range'] = [month_range.get(d) for d in df['Date'].dt.month]

Выход:

    Date        Range
0   2019-03-27   4
1   2019-10-08   2
2   2019-04-09   5
3   2018-08-09   1
1 голос
/ 06 апреля 2019

Я пытаюсь создать словарь с numpy.roll, numpy.repeat, numpy.arange и последним использованием Series.map с Series.dt.month:

a = np.arange(1, 13)
b = np.roll(np.repeat(np.arange(1,7), 2), 7)
d = dict(zip(a, b))
print (d)
{1: 3, 2: 4, 3: 4, 4: 5, 5: 5, 6: 6, 7: 6, 8: 1, 9: 1, 10: 2, 11: 2, 12: 3}

df['Range'] = df['Date'].dt.month.map(d)
print (df)
        Date  Range
0 2019-03-27      4
1 2019-10-08      2
2 2019-04-09      5
3 2018-08-09      1
...