У меня есть две таблицы, в которых есть данные, в одной из которых дата и время электронной почты открыты (отправлены по электронной почте), а другая ссылка нажата (отправлена по электронной почте) человеком.Я пытаюсь объединить данные в одну таблицу с открытыми и щелчками по электронной почте.
| ID | EmailopenedDateTime| | ID | EmailClickedDateTime |
| 1 | 2019-07-02 22:05:26| | 1 | 2019-07-02 22:05:41 |
| 2 | 2019-07-03 22:44:14|
Я пытался использовать правильное соединение, но получаю вывод как
| ID | EmailopenedDateTime| EmailClickedDateTime |
| 1 | 2019-07-02 22:05:26| 2019-07-02 22:05:41 |
| 2 | 2019-07-03 22:44:14| 2019-07-02 22:05:41 |
Select
emailopened.id,
emailclick.EmailClickedDateTime
emailopened.EmailopenedDateTime
from emailclicked emailclick
right join
emailopened emailopened
on
emailclick.id = emailopened.id
Но выводя ожидаю, что это будет
| ID | EmailopenedDAteTime| EmailClickedDateTime |
| 1 | 2019-07-02 22:05:26| 2019-07-02 22:05:41 |
| 2 | 2019-07-03 22:44:14| NULL |
Буду также признателен, если pyspark будет полезен.