Получение нулевого значения при попытке изменить тип данных в pyspark - PullRequest
0 голосов
/ 01 ноября 2019

У меня есть набор данных C1.txt, в котором есть один столбец с именем features. Все строки являются строками и представляют собой x и y, координаты двумерной точки. Я хочу изменить тип на double, но когда я делаю это с помощью этого кода:

from pyspark.sql.types import(StructField,StringType,IntegerType,StructType,DoubleType) 
changedTypedf =df.withColumn("features", df["features"].cast(DoubleType()))

Я получаю значение NULL для всех строк (до изменения типа данных) .

after changing datatype

Я не знаю, что не так, пожалуйста, помогите мне решить эту проблему. Спасибо

...