У меня есть набор данных, в котором я должен предсказать строку на основе предыдущих двух строк.
Я создал отображение из заданного набора данных:
a,b -> c
b,c -> d
Я вижу многослучаев, когда:
a,b -> c <40 times >
a,b -> x < 15 times >
a,b -> y <3 times >
Я хочу добавить некоторые веса, основанные на количестве вхождений, и дерево решений должно указывать на цель в зависимости от максимального вхождения.
В приведенном вышеНапример, он всегда должен указывать на c
, а не x
или y
, поскольку c
имеет наибольшую вероятность.
Как мне добиться такого поведения?
Прямо сейчасЯ использую векторизатор подсчета и отправляю векторную форму предложения (a,b)
в дерево решений для обучения.