Это будет go, как это. Предположим, у вас есть фрейм данных с именем df и столбцами в нем «X1», «X2», «Y».
Сначала вам нужно сгруппировать независимые переменные - «X1», «X2» в один столбец с именем «функции». Ниже приведен код для этого.
new_df = VectorAssembler(inputCols=["X1", "X2"], outputCol="features")
Теперь ваш new_df будет иметь столбцы - "X1", "X2", "features", "Y".
Теперь есть время для запуска линейной регрессии типа
model = LinearRegression(labelCol="Y").fit(training_data)