Я хочу объединить два кадра данных по метке времени столбца df2.join(df1, how='left')
. Следующий столбец отметки времени df1
является условием остановки
Данных для присоединения
df1 = spark.createDataFrame(
[(1, 110, 'walk', 'work', '2019-09-28 13:40:00'),
(2, 110, 'metro', 'work', '2019-09-28 14:00:00'),
(3, 110, 'walk', 'work', '2019-09-28 14:02:00'),
(4, 120, 'bus', 'home', '2019-09-28 17:00:00'),
(5, 120, 'metro', 'home', '2019-09-28 17:20:00'),
(6, 120, 'walk', 'home', '2019-09-28 17:45:00')],
['id', 'u_uuid', 'mode', 'place', 'timestamp']
)
df2 = spark.createDataFrame(
[(1, '2019-09-28 13:30:00'),
(2, '2019-09-28 13:35:00'),
(3, '2019-09-28 13:39:00'),
(4, '2019-09-28 13:50:00'),
(5, '2019-09-28 13:55:00'),
(6, '2019-09-28 14:01:00'),
(7, '2019-09-28 16:30:00'),
(8, '2019-09-28 16:40:00'),
(9, '2019-09-28 16:50:00'),
(10, '2019-09-28 17:25:00'),
(11, '2019-09-28 17:30:00'),
(12, '2019-09-28 17:35:00')],
['id', 'timestamp']
)
Цель
![enter image description here](https://i.stack.imgur.com/t9K58.png)