У меня есть набор данных C1.txt, в котором есть один столбец с именем features. Все строки являются строками и представляют собой x и y, координаты двумерной точки. Я хочу изменить тип на double, но когда я делаю это с помощью этого кода:
from pyspark.sql.types import(StructField,StringType,IntegerType,StructType,DoubleType)
changedTypedf =df.withColumn("features", df["features"].cast(DoubleType()))
Я получаю значение NULL для всех строк (до изменения типа данных) .
![after changing datatype](https://i.stack.imgur.com/ngJmF.png)
Я не знаю, что не так, пожалуйста, помогите мне решить эту проблему. Спасибо