Я имею дело с очень большим размером данных.Ниже приведен небольшой пример:
import pandas as pd
df = pd.DataFrame({'nodes': ['A', 'B', 'C'],
'dept': ['20:00', '02:00', '21:00'],
'arrv': ['20:00', '17:00', '21:00'],
'dept_offset_day': [0, 1, 0],
'arrv_offset_day': [0, 1, 0],
'stop_num':[0,1,2]})
print(df)
nodes dept arrv dept_offset_day arrv_offset_day
0 A 20:00 20:00 0 0
1 B 02:00 17:00 1 1
2 C 21:00 21:00 0 0
Я пытаюсь 1) добавить дату в время начала и окончания, учитывая смещения дня.2) разбить столбец узлов на два столбца node_start и node_end, т.е. указать на точки.Примерно так:
nodes_start nodes_end start_datetime end_datetime
A B 2019-5-9 20:00 2019-5-10 02:00
B C 2019-5-10 17:00 2019-5-10 21:00
Я пытался использовать pd.offsets.Day () и перебирать каждую строку, но это делает время выполнения очень медленным, и я получаю неправильные даты.Спасибо за вашу помощь.