Я немного сбит с толку из-за VectorAssembler, если у меня есть несколько фреймов данных, то какие временные фреймы будет обрабатывать VectorAssembler
from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssemblerdata
data= spark.read.csv("Ecommerce_Customers.csv",inferSchema=True,header=True)
assembler = VectorAssembler(
inputCols=["Avg Session Length", "Time on App",
"Time on Website",'Length of Membership'],
outputCol="features")
и вот оно фрейм данных, представленный в этом коде, который представляет собой «данные», и здесь все столбцы, упомянутые в столбце, имеют отношение к inputCols.
, поэтому мой вопрос: если у меня есть несколько фреймов данных, то какие фреймы данных будут VectorAssembler подберет для обработки данных?