У меня есть столбец векторного типа с одним значением в каждом векторе.Я хочу получить только это значение и сохранить столбец как doubleType.
пример ввода df:
|testcol|
[1.3]|
[1.2]|
[3.4]|
желаемый вывод df:
|testcol|
|1.3|
|1.2|
|3.4|
Код, который у меня естьдо сих пор:
remove_vector_func = udf(lambda x: list(x)[0], DoubleType())
ex= ex.withColumn("testcol", remove_vector_func("testcol"))
Этот код выполняется, но когда я пытаюсь показать столбец, он продолжает выдавать ошибку:
ожидаемый нулевой аргумент для построения ClassDict (для numpy.dtype)
В printSchema () я вижу, что тип столбца правильный:
testcol: double (nullable = true)