Py4JJavaError: Произошла ошибка при вызове o37.load - PullRequest
0 голосов
/ 10 октября 2019

Я довольно новичок в пространстве Pyspark, и я сталкиваюсь со следующей ошибкой, когда пытаюсь загрузить текстовый файл из образца набора данных.

from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('lrex').getOrCreate()
from pyspark.ml.regression import LinearRegression
training = spark.read.format('libsvm').load('sample_linear_regression_data.txt')

Py4JJavaError: Произошла ошибка при вызове o37.load. : java.lang.UnsupportedOperationException: пустая коллекция в org.apache.spark.rdd.RDD $$ anonfun $ уменьшить $ 1 $$ anonfun $ применить $ 35.apply (RDD.scala: 1037) в org.apache.spark.rdd.RDD$$ anonfun $ уменьшить $ 1 $$ anonfun $ применить $ 35.apply (RDD.scala: 1037) в scala.Option.getOrElse (Option.scala: 121) в org.apache.spark.rdd.RDD $$ anonfun $ уменьшить $ 1.apply (RDD.scala: 1037) в org.apache.spark.rdd.RDDOperationScope $ .withScope (RDDOperationScope.scala: 151) в org.apache.spark.rdd.RDDOperationScope $ .withScope (RDDOperationScope.scala: 112)org.apache.spark.rdd.RDD.withScope (RDD.scala: 363) в org.apache.spark.rdd.RDD.reduce (RDD.scala: 1017) в org.apache.spark.mllib.util.MLUtils $.computeNumFeatures (MLUtils.scala: 94) в org.apache.spark.ml.source.libsvm.LibSVMFileFormat $$ anonfun $ 1.apply $ mcI $ sp (LibSVMRelation.scala: 104) в org.apache.spark.ml.source.libsvm.LibSVMFileFormat $$ anonfun $ 1.apply (LibSVMRelation.scala: 95) в org.apache.spark.ml.source.libsvm.LibSVMFileFormat $$ anonfun $ 1.apply (LibSVMRelation.scala: 95) в scala.Option.getOrElse (Option.scala: 121) в org.apache.spark.ml.source.libsvm.LibSVMFileFormat.inferSchema (LibSVMRelation.scala: 95) в org.apache.spark.sql.execution.datasources.DataSource $$ anonfun $ 6.apply (DataSource.scala: 180) в org.apache.spark.sql.execution.datasources.DataSource $$ anonfun $ 6.apply (DataSource.scala: 180) в scala.Option.orElse (Option.scala: 289) вorg.apache.spark.sql.execution.datasources.DataSource.getOrInferFileFormatSchema (DataSource.scala: 179) в org.apache.spark.sql.execution.datasources.DataSource.resolveRelation (DataSource.scala: 373) в org.ap. spark.sql.DataFrameReader.loadV1Source (DataFrameReader.scala: 223) в org.apache.spark.sql.DataFrameReader.load (DataFrameReader.scala: 211) в org.apache.spark.sql.DataFrameReader.load (DataFrameReader.sca. 178) в sun.reflect.NativeMethodAccessorImpl.invoke0 (собственный метод) в sun.reflect.NativeMethodAccessorImpl.invoke (неизвестный источник) в sun.reflect.DelegatingMethodAccessorImpl.invoke (неизвестный источник) в java.lectdhognvoke (Неизвестный источник) в py4j.reflection.MethodInvoker.invoke (MethodInvoker.java:244) в py4j.reflection.ReflectionEngine.invoke (ReflectionEngine.java:357) в py4j.Gateway.invoke (Gateway.java:282) в py.commands.AbstractCommand.invokeMethod (AbstractCommand.java:132) в py4j.commands.CallCommand.execute (CallCommand.java:79) в py4j.GatewayConnection.run (GatewayConnection.java:238) в java.lang.Thread.unНеизвестный источник) '

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...