У меня есть следующий RDD строк. Как видно, каждое поле является строковым типом
[Row(A='6', B='1', C='hi'),
Row(A='4', B='5', C='bye'),
Row(A='8', B='9', C='night')]
Я хочу преобразовать этот RDD в фрейм данных с IntegerTypes для столбцов A и B
dtypes = [
StructField('A', IntegerType(), True),
StructField('B', IntegerType(), True),
StructField('C', StringType(), True)
]
df = spark.createDataFrame(rdd, StructType(dtypes))
Я получаю следующую ошибку:
TypeError: field A: IntegerType can not accept
object '6' in type <class 'str'>
Как я могу успешно преобразовать '6' в IntegerType?