У меня есть RDD, построенный из фрейма данных с 1 столбцом, помеченного как «особенности», к которому я хотел бы применить модель. Я хотел бы преобразовать его в массив чисел с плавающей точкой, чтобы сделать это. Я сделал это:
df_rdd = df_rdd.map(lambda line: [float(i) for i in line])
Я получил эту ошибку при попытке показать содержимое СДР:
ValueError: could not convert string to float: [-0.08356357429744941, 0.08524966674774039, -0.0784185383554695, -0.21859354442123433, -0.06993846447509879, -0.01691160239319382, -0.009708906425531714]
Может кто-нибудь помочь мне с этим, пожалуйста? Я также попробовал df_rdd = df_rdd.map(lambda line: [float(i) for i in line.split(' '))
, которая выдает следующую ошибку: AttributeError: split
Я был бы очень благодарен, если вы могли бы помочь, поскольку я почти закончу с моим проектом !!