pyspark один ко многим присоединиться к операции - PullRequest
0 голосов
/ 20 сентября 2019

в фрейме pysparkдопустим, что есть dfA и dfB,

dfA : name , class
dfB : class, time

, если dfA.select ('class'). Different (). count () = n, когда n равно n <100, n> 100000, * 1004.*

когда я оперирую объединением для этих двух случаев, как мне оптимизировать объединение?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...