dailygirlflower 20 сентября 2019 9

pyspark один ко многим присоединиться к операции

dailygirlflower / 20 сентября 2019

в фрейме pysparkдопустим, что есть dfA и dfB,

dfA : name , class
dfB : class, time

, если dfA.select ('class'). Different (). count () = n, когда n равно n <100, n> 100000, * 1004.*

когда я оперирую объединением для этих двух случаев, как мне оптимизировать объединение?

...

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.