Я создаю пустой фрейм данных и позже пытаюсь добавить к нему другой фрейм данных. На самом деле я хочу динамически добавлять множество фреймов данных в первоначально пустой фрейм данных, в зависимости от количества поступающих RDD.
Функция union () работает нормально, если я присваиваю значение другому третьему фрейму данных.
val df3=df1.union(df2)
Но я хочу продолжать добавлять к исходному фрейму данных (пустому), который я создал, потому что я хочу хранить все RDD в одном фрейме данных. Однако приведенный ниже код не показывает правильные значения. Похоже, он просто не дописал
df1.union(df2)
df1.count() // this shows 0 although df2 has some data and that is shown if I assign to third datafram.
Если я сделаю следующее (я получаю ошибку переназначения, так как df1 равен val. И если я изменяю его на тип var, я получаю многопоточность kafka, не безопасную ошибку.
df1=d1.union(df2)
Есть идеи, как добавить все динамически созданные кадры данных в один изначально созданный фрейм данных?