Может кто-нибудь объяснить, почему я получаю ошибку:
Объект 'DataFrame' не поддерживает назначение элементов
Я выполняю следующую команду на платформе databricks / spark
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('ops').getOrCreate()
import sys
from pyspark.sql.types import *
Расположение и тип файла
file_location = "/FileStore/tables/cc3_stringfunctions.csv"
file_type = "csv"
# CSV options
infer_schema = "true"
first_row_is_header = "true"
delimiter = ","
# The applied options are for CSV files. For other file types, these will be ignored.
df = spark.read.format(file_type) \
.option("inferSchema", infer_schema) \
.option("header", first_row_is_header) \
.option("sep", delimiter) \
.load(file_location)
display(df)
Ниже приведен фактический код:
def employeeFirstName(df):
df['FirstName'] = 0
for i in range(len(df['EmployeeName'])):
df['FirstName'][i] = df['EmployeeName'][i].split(' ')[0].lower()
return df
newData = employeeFirstName(df)
print(newData.columns[9])
print(newData.FirstName.head().to_string(index=False).replace(' ',''))
Ошибка приведенного выше кода:
TypeError: 'DataFrame' object does not support item assignment
Есть мысли?