в фрейме pysparkдопустим, что есть dfA и dfB,
dfA : name , class
dfB : class, time
, если dfA.select ('class'). Different (). count () = n, когда n равно n <100, n> 100000, * 1004.*
когда я оперирую объединением для этих двух случаев, как мне оптимизировать объединение?