Итак, я разрабатываю модель для классификации набора данных по уровням риска.
Набор данных помечен на основе оценки, полученной от обследуемого.Теперь, из этого опроса, у меня будет максимум и минимум очков.Я читал статью, в которой они обозначают набор данных как «Высокий» или «Низкий», основываясь на общем среднем балле опроса.
Мне интересно, есть ли какой-нибудь метод для разработкимодель для классификации на основе вероятности (например, экземпляр данных составляет 60% к максимальной оценке), или возможный метод состоит в том, чтобы разделить оценку на основе децилей или квартилей.
Я все еще новичокдля такого рода проблем, поэтому любые советы / ответы будут очень признательны.Любые ключевые слова, по которым я буду искать, также будут очень благодарны.
Заранее спасибо!