Трудно сказать, не зная больше, но с байесовской точки зрения вас может заинтересовать случай отсутствующих функций .Я буду обсуждать в общих чертах.Для получения дополнительной информации см. [Duda and Hart, 2nd ed., Pp. 54-55].
Для любого классификатора Байесовское правило принятия решения заключается в выборе класса i , который максимизирует вероятностькласс i встречается при условии, что наблюдались данные x , то есть max P (i | x) .Вектор x содержит признаки, например, оценки, возраст и т. Д. Ученика
Не все учащиеся посещают одни и те же классы, поэтому вектор признаков x может быть пустымэлементы, т. е. «отсутствующие функции».В этом случае вы должны маргинализировать по отсутствующим элементам, т. Е. Просто суммировать по отсутствующим элементам, а затем принять решение о хороших, оставшихся элементах.
Пример.Предположим, что студент изучал биологию, но не химию:
P(student drops out | A+ in biology)
= P(student drops out, A+ in biology)/P(A+ in biology)
= P(student drops out, A+ in biology, A in chemistry)
---------------------------------------------------
P(A+ in biology, A in chemistry)
+
P(student drops out, A+ in biology, B in chemistry)
---------------------------------------------------
P(A+ in biology, B in chemistry)
+ ... +
P(student drops out, A+ in biology, F in chemistry)
---------------------------------------------------
P(A+ in biology, F in chemistry)