Выходные столбцы метода OneHotEncoderModel.transform () кодируются как SparseVector. Вы должны были бы вручную создать отдельные векторы, чтобы вернуть их в Панды. Отправьте исходные столбцы (входные данные в кодировщик Spark) в Pandas и перекодируйте их там, если они необходимы.
Оценщикам Spark (таким как Логистическая регрессия) потребуется версия в кодировке Sparse Vector, и вы действительно не хотите расширять их на стороне Spark, если ваши данные большие. Возможно, то, что вам нужно сделать на стороне Панд, достаточно мало, чтобы сделать их расширение терпимым?