как VectorAssembler знает, какой DataFrame брать в pyspark? - PullRequest
0 голосов
/ 28 марта 2020

Я немного сбит с толку из-за VectorAssembler, если у меня есть несколько фреймов данных, то какие временные фреймы будет обрабатывать VectorAssembler

from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssemblerdata 

data= spark.read.csv("Ecommerce_Customers.csv",inferSchema=True,header=True)

assembler = VectorAssembler(
    inputCols=["Avg Session Length", "Time on App", 
               "Time on Website",'Length of Membership'],
    outputCol="features")

и вот оно фрейм данных, представленный в этом коде, который представляет собой «данные», и здесь все столбцы, упомянутые в столбце, имеют отношение к inputCols.

, поэтому мой вопрос: если у меня есть несколько фреймов данных, то какие фреймы данных будут VectorAssembler подберет для обработки данных?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...