Когда я создаю фрейм данных из RDD, применяя схему, он выдает ошибку
Msgstr "Целочисленный тип не может принимать объект '24' в типе".
Это мой код:
myschema = StructType([StructField('name',StringType(),False),StructField('age',IntegerType(),False])
rdd = sc.textFile('/some/src.csv')
another_rdd = rdd.map(lambda i:i.encode('ascii').split(','))
df = sqlContext.createDataFrame(another_rdd, myschema)
my input (src.csv) looks like:
nive,24
pras,27
Нужно ли указывать поле возраста для int или есть какой-то другой способ?