Как ничего не извлечь из искрового фрейма данных.
Мне нужно что-то вроде этого,
df.where ("1" === "2")
Мне нужно это, чтобы яможно сделать левое соединение с другим кадромПо сути, я пытаюсь избежать перекоса данных при объединении двух информационных фреймов, разделяя столбцы с нулевым и ненулевым ключами и объединяя их по отдельности, а затем объединяя их.
df1 имеет 300M записей, из которых 200M записей имеют Nullключи.У df2 есть еще 300M записей.
Итак, чтобы присоединиться к ним, я разделяю df1, содержащий нулевые и не нулевые ключи, и затем соединяю их с df2.поэтому, чтобы соединить кадр данных с нулевым ключом с df2, мне не нужны никакие записи из df2.
Я могу просто добавить столбцы из df2 в нулевой ключ df1, но любопытно посмотреть, есть ли у нас что-то подобное вspark
df.where ("1" === "2")
Как мы делаем в SQL RDBMS.