Мне нужно внести несколько изменений в алгоритм случайного леса spark mllib.Я получил исходный код от https://github.com/apache/spark.Я собрал JAR-файл с использованием maven, но в JAR-файле, который я создал, отсутствуют некоторые классы, входящие в исходный JAR-файл MLLib (SPARK Downloads).
Я собрал код на машине linux с помощью maven.* Команда, использованная для сборки, была ./build/mvn -DskipTests clean package.
Оригинальный JAR доступен в https://mvnrepository.com/artifact/org.apache.spark/spark-mllib_2.11/2.4.3
Размер JAR-файла должен составлять 7,65 МБ.,Но я получаю JAR размером 5,4 МБ с именем spark-mllib_2.12-3.0.0-SNAPSHOT.