У меня большой проект со Spark с использованием Java.Я прочитал CSV-файл с более чем 1.000.000 строк и один столбец является строкой.
Когда я пытаюсь сделать VectorAssembler для использования алгоритма ML, у меня появляется ошибка, потому что столбец "Луна" является строкой.
Так что я пытаюсь преобразовать эту строку в целое число с помощью этого:
Dataset<Row> moons = typedMoons.withColumn("Moon", typedMoons.col("Moon").cast("Integer"));
Но когда я делаю это, я получаю нулевое значение в этом столбце.
Такя пытаюсь выполнить na.fill () с помощью Java:
Dataset<Row> typedMoonsfinal = typedMoons.na().fill("Moon", typedMoons.col("Moon"));
Но я не использую well fill ().
Некоторые рекомендации по устранению этой проблемы или другие способы?
Большое спасибо и всего наилучшего.