Способ предсказать процент с помощью машинного обучения - PullRequest
0 голосов
/ 29 февраля 2020

Используя scikit-learn и python, вы можете выполнять классификацию моделей. Большинство из них имеют две (или небольшое, заданное количество) категорий.

Например, если вы прогнозировали диагноз заболевания, две категории могут быть да и нет. Да означает, что у пациента есть заболевание, нет, значит, у пациента нет заболевания. Но что бы вы сделали, если бы вы хотели проценты? Например, если вы не хотите говорить, что у пациента либо было , либо не было заболевания, но вместо этого было значение, равное 80% вероятности или 25% вероятности заболевания. делать.

Я сделал это с меньшим количеством значений x (1 или 2). Там у меня было около 5000 строк данных, и я округлил значения x и сгруппировал строки с одинаковыми (или похожими) значениями x вместе, и нашел процент от да и нет. Например, если 50 рядов были сгруппированы вместе, и в 30 из них был обнаружен пациент с заболеванием, новое значение y составило бы 60%.

Это не работает с большим количеством значений x, так как количество строк, которые могут быть сгруппированы вместе, становится меньше. Так как ты это делаешь? Если у вас есть данные для да и нет, как вы можете изменить это на процент?

...