Является ли логистическая регрессия лучшим методом для создания модели оценки? - PullRequest
0 голосов
/ 17 июня 2019

У меня есть набор данных о пользователях, в котором я хочу создать оценку для каждого пользователя.

Необходимый выходной диапазон выглядит как низкий, средний и высокий. Я работаю над логистической регрессией.

Это правильный подход к решению таких проблем?

Есть предложения?

1 Ответ

1 голос
/ 17 июня 2019

Чтобы ответить на ваш вопрос: Это приличная - в большинстве случаев предлагается - модель для начала.

Более важный вопрос, который, на мой взгляд, вы должны здесь задать, это то, КАКОЙ тип пользовательских данных у вас есть, и КАК они работают с выбранной моделью:

  - data has a large number of features: you probably want to run a PCA, XGBOOST or another feature importance evaluation to separate useful features from noise features
  - you have a large amount of text data, i.e. logs: you might want to attach a naive Bayes, tf/idf or another model that performs well with text-based data
  - does your data tend to overfit when using model X? Maybe you want to do data engineering or try a different model

Я предлагаю вам сначала построить модель LR и посмотреть, как она работает с вашими наборами данных поезд / тестировать / предсказать, и оценить, является ли производительность приемлемой для ваших нужд, и только затем подумать / обсудить различные модели / подходы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...