Я работаю с python, и в настоящее время у меня есть пара экземпляров класса pyspark.sql.column.Column
, и я хотел бы объединить их так, чтобы я получил объект pyspark.sql.dataframe.DataFrame
с упомянутыми столбцами. Позвольте мне проиллюстрировать это на следующем примере с игрушкой.
Пример игрушек
1) Давайте сначала создадим пример фрейма данных pyspark, чтобы иметь возможность получить два примера столбцов.
from pyspark.sql import SQLContext
# Create a DataFrame
df = sqlContext.createDataFrame([("Jordi", 14, 45), ("Elisabeth", 22, 63), ("Aina", 8, 35)], ("name", "age", "weight"))
# Get two columns
col1 = df.name
col2 = df.age
2) Теперь моя цель - объединить переменные col1
и col2
в один DataFrame, чтобы этот новый DataFrame содержал два столбца:
| name | age |
|-----------+--------|
| Jordi | 14 |
| Elisabeth | 22 |
| Aina | 8 |