У меня есть два набора данных данных временных рядов. Мне нужно суммировать эти два набора данных, используя, вероятно, какой-то подход оконного подхода Временные метки различны для двух наборов данных Результатом будетсумма полей «значения» из обоих наборов данных, которая попадает в окно результирующего набора данных.
Есть ли в Spark встроенные функции, позволяющие сделать это легко? Или как мне добиться этого наилучшим образом
DataSet-1
raw_data_field_id | date_time_epoch | value
-------------------+-----------------+-----------
23 | 1528766100068 | 131
23 | 1528765200058 | 130.60001
23 | 1528764300049 | 130.3
23 | 1528763400063 | 130
23 | 1528762500059 | 129.60001
23 | 1528761600050 | 129.3
23 | 1528760700051 | 128.89999
23 | 1528759800047 | 128.60001
DataSet-2
raw_data_field_id | date_time_epoch | value
-------------------+-----------------+-----------
24 | 1528766100000 | 41
24 | 1528765200000 | 60
24 | 1528764300000 | 30.03
24 | 1528763400000 | 43
24 | 1528762500000 | 34.01
24 | 1528761600000 | 29.36
24 | 1528760700000 | 48.99
24 | 1528759800000 | 28.01