Поддерживает ли какой-либо алгоритм Н2О классификацию по нескольким меткам? - PullRequest
0 голосов
/ 08 декабря 2018

Поддерживает ли модель глубокого обучения проблему классификации по нескольким меткам или какие-либо другие алгоритмы в H2O?

Orginal Response Variable -Tags:

apps, email, mail
finance,freelancers,contractors,zen99
genomes
gogovan
brazil,china,cloudflare
hauling,service,moving
ferguson,crowdfunding,beacon
cms,naytev
y,combinator
in,store,
conversion,logic,ad,attribution

После сопоставления их по клавишам словаря: Тогда

Переменная ответа выглядитэто:

[74]
[156, 89]
[153, 13, 133, 40]
[150]
[474, 277, 113]
[181, 117]
[15, 87, 8, 11]

Спасибо

Ответы [ 2 ]

0 голосов
/ 09 декабря 2018

Любой алгоритм, который создает модель, которая дает вам «финансы, фрилансеры, подрядчики, zen99» для одного набора входных данных и «cms, найтев» для другого набора входных данных, ужасно перегружен.Вы должны сделать шаг назад и подумать, каков ваш настоящий вопрос.

Но вместо этого есть одна идея: обучить встраиванию некоторых слов (или использовать некоторые предварительно обученные) в ваших ответных словах.,Затем вы можете усреднить векторы для каждого набора значений и надеяться, что это даст вам хорошее числовое представление «темы».Затем вам нужно превратить ваш, скажем, 100-мерный усредненный вектор слов в одно число (на ум приходит PCA).И теперь у вас есть единственное число, которое вы можете присвоить алгоритму машинного обучения и которое он может предсказать.

У вас все еще есть проблема: предсказав число, как вы превращаете это число в 100-дим вектор, а оттуда в тему, а оттуда в тему слова?Сложно, но, возможно, не невозможно.

(Кроме того, если вы превратите вышеуказанное «единственное число» в фактор и предложите модели машинного обучения выполнить категоризацию, чтобы предсказать наиболее похожую тему на те, которые онавидел раньше ... вы в основном прошли полный круг и получите модель, идентичную , модель, с которой вы начали, имеет слишком много классов .)

0 голосов
/ 09 декабря 2018

Нет, H2O содержит только алгоритмы, которые учатся предсказывать одну переменную ответа за раз.Вы можете превратить каждую уникальную комбинацию в один класс и таким образом обучить мультиклассовую модель или прогнозировать каждый класс с помощью отдельной модели.

...