допустим, у вас есть этот фрейм данных:
df = pd.DataFrame( data = [ '2014-04-07 10:55:35.087000+00:00',
'2014-04-07 13:59:37.251500+00:00',
'2014-04-02 13:23:59.629000+00:00',
'2014-04-07 12:17:48.182000+00:00',
'2014-04-06 17:00:23.912000+00:00'],
columns = ['timestamp'],
dtype = np.datetime64
)
, и вы хотите создать новый столбец, значения которого равны 1, если отметка времени является днем недели, или 0, если это не так. Тогда я бы запустил что-то вроде этого:
df['weekday'] = df['timestamp'].apply(lambda x: 1 if x.weekday() < 5 else 0 )
Пока все хорошо. Тем не менее, в моем случае у меня есть около 10 миллионов строк с такими значениями меток времени, и для запуска требуется всего вечность. Итак, я искал варианты векторизации и нашел numpy.where()
. Но, конечно, это не работает: np.where(df['timestamp'].weekday() < 5, 1, 0)
Итак, есть ли способ доступа к методу .weekday () временных меток при использовании numpy .where или есть какой-либо другой способ создать столбец дня недели, если в нем 10 миллионов строк? Спасибо.