У меня есть два фрейма данных pyspark, A & B
A имеет два столбца date, symbol
B имеет два столбца date2 entity
я просто хочу получить union
и intersection
из этих двух df на основе дат
, например, если df A как
+----------+------+
| date|symbol|
+----------+------+
|2013-08-30| A|
|2013-08-30| AAL|
|2013-08-30| AAP|
|2013-08-30| AAPL|
|2013-08-30| ABBV|
+----------+------+
и B как:
+----------+-------------+
| day|entity_ticker|
+----------+-------------+
|2013-08-30| A|
|2013-08-30| AAL|
|2013-08-30| AAP|
|2013-08-30| AAPL|
|2013-08-30| ABC|
+----------+-------------+
я просто хочу объединение как
+----------+--------------------------------+
| dd |union_of_sybols |
+----------+--------------------------------+
|2013-08-30| [A,AAL,AAP,AAPL,ABBV,ABC]|
+----------+--------------------------------+
и пересечение как:
+----------+--------------------------------+
| dd |intersection_of_sybols |
+----------+--------------------------------+
|2013-08-30| [A,AAL,AAP,AAPL] |
+----------+--------------------------------+
заранее спасибо