Python Tuning Decision tree для определения весов на основе количества - PullRequest
0 голосов
/ 28 сентября 2018

У меня есть набор данных, в котором я должен предсказать строку на основе предыдущих двух строк.

Я создал отображение из заданного набора данных:

a,b -> c 
b,c -> d 

Я вижу многослучаев, когда:

a,b -> c <40 times >
a,b -> x < 15 times >
a,b -> y <3 times >

Я хочу добавить некоторые веса, основанные на количестве вхождений, и дерево решений должно указывать на цель в зависимости от максимального вхождения.

В приведенном вышеНапример, он всегда должен указывать на c, а не x или y, поскольку c имеет наибольшую вероятность.

Как мне добиться такого поведения?

Прямо сейчасЯ использую векторизатор подсчета и отправляю векторную форму предложения (a,b) в дерево решений для обучения.

...