введите описание изображения здесь
df1 имеет 92851 рядов × 6 столбцов и
df2 имеет 92851 рядов × 3 столбца.
Но когда я пытаюсь объединить два фрейма данных в один, я получаю мощность в виде 255089 строк × 7 столбцов. Это должно быть 92851 строк х 7 столбцов.
Почему это происходит?
df=pd.merge(df1,df2,on=['source','destination'])
Вы можете использовать join вместо слияния.
join
SCALA-код
val newDF = df1 .join(df2, Seq("source", "destination"), "left_outer")
PYTHON-код
newDF = df1 .join(df2, ['source', 'destination'], 'left_outer')