Итак, скажите для каждой моей «вещи», которую я должен классифицировать:
{дом, квартира, бунгало, электричество с подогревом, газ с подогревом, ...}
Что будет превращено в вектор признаков:
{1,0,0,1,0, ...} что означает дом, который отапливается электричеством.
Для моих тренировочных данных у меня были бы все эти данные - но для фактической вещи, которую я хочу классифицировать, у меня могло бы быть только то, какой это дом, и пара других вещей - не все данные, т.е.
{1,0,0,?,?, ...}
Так как бы это представить?
Я бы хотел найти вероятность того, что новый предмет будет подогреваться газом.
Я бы использовал линейный классификатор SVM - у меня нет никакого ядра, чтобы показать, потому что это чисто теоретический момент. Любая помощь будет оценена :)