Я пытаюсь рассчитать рабочие дни между тремя столбцами, в одном столбце могут быть пустые значения.Я получаю сообщение об ошибке 'NaTType does not support time'
.
import pandas as pd
import numpy as np
raw = pd.read_excel(r'C:\Desktop\RAW.xlsx',
sheet_name = 'RAW',
header = 0
)
raw['CREATEDATE'] = pd.to_datetime(raw['CREATE_DATE'])
raw['RELEASEDDATE'] = pd.to_datetime(raw['RELEASED_DATE'])
raw['REASSIGNDATE']= pd.to_datetime(raw['REASSIGN_DATE'],errors='coerce')
if raw['REASSIGNDATE'].any()=='':
raw['RELEASED_DAYS']=raw.apply(lambda x: pd.date_range(x.CREATEDATE,x.RELEASEDDATE,freq=BDay()),axis=1)
else:
raw['RELEASED_DAYS']=raw.apply(lambda x: pd.date_range(x.REASSIGNDATE,x.RELEASEDDATE,freq=BDay()),axis=1)
Я получаю сообщение об ошибке ValueError: ('NaTType не поддерживает время', 'произошло с индексом 0')
Я даже пытался создать дваразделите переменные D1 и D2, используя np.busday_count для получения сетевых дней.
и попытайтесь np.where, где я все еще получаю ту же ошибку.
Я не могу отбросить строки, так как каждая строка считается.
Пример необработанных данных
CREATE_DATE RELEASED_DATE REASSIGN_DATE
10/22/2018 10/22/2018
10/19/2018 10/22/2018 10/24/2018
10/19/2018 10/22/2018 10/24/2018
Любые предложения, как это исправить.
С уважением, Рен.