Spark MLlib: разница между DecisionTree.trainClassifier и DecisionTree.train - PullRequest
0 голосов
/ 21 января 2019

Я не вижу разницы между DecisionTree.trainClassifier и DecisionTree.train методами.

В коде для DecisionTree есть некоторые подсказки.Комментарий для train:

Метод обучения модели дерева решений.Метод поддерживает двоичную и мультиклассовую классификацию и регрессию.

И комментарий для trainClassifier:

Метод обучения модели дерева решений для двоичной или мультиклассовой классификации.

Поскольку я хотел бы использовать двоичную классификацию, я думаю, что лучше всего использовать метод DecisionTree.trainClassifier.Но я хотел бы понять различия.

Есть идеи?

1 Ответ

0 голосов
/ 21 января 2019

trainClassifier - это, по сути, перегрузка train, когда алгоритм предварительно настроен на Classifier

ниже I *** предустановленного параметра Classification в исходном коде, на который вы ссылались

 def trainClassifier(
      input: RDD[LabeledPoint],
      numClasses: Int,
      categoricalFeaturesInfo: Map[Int, Int],
      impurity: String,
      maxDepth: Int,
      maxBins: Int): DecisionTreeModel = {
    val impurityType = Impurities.fromString(impurity)
    train(input, ***Classification***, impurityType, maxDepth, numClasses, maxBins, Sort,
      categoricalFeaturesInfo)
  }
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...