Несколько классификаций из прогнозирующего классификатора - PullRequest
0 голосов
/ 24 ноября 2011

У меня есть проблема классификации, когда я хотел бы предсказать результат, но хотел бы, чтобы мой классификатор получил несколько «попыток» на ответ (что-то вроде размещения ставки в один конец), а не одну классификацию, которая либоправильный или неправильный, и он задавался вопросом о лучшем процессе для этого.

Пример: Учитывая результаты A, B, C и D, я хотел бы предсказать, что это будет «A или B», или «A или C, и «правильные» решения (те, которые, по крайней мере, содержат правильный индивидуальный ответ) соответственно влияют на процесс обучения.

До сих пор я думал о том, чтобы разделить набор данныхв бункеры, более или менее, как указано выше (A или C), и обучить классификатор обычным способом, или обучить несколько классификаторов таким образом, чтобы они были различны, и просто объединить результаты, но мне было интересно, есть ли лучший / другойпуть?Я уверен, что это не может быть уникальной проблемой, но я не уверен в правильной терминологии для Google.

Я не знаю, является ли это связанной проблемой, но есть ли способвключить в опциях «я не знаю» - т.е.не делать классификацию?

1 Ответ

1 голос
/ 24 ноября 2011

Многие классификаторы могут делать то, что вы хотите.
Наивный Байес может дать вам вероятности для каждой метки, так что вы можете взять k наиболее вероятных меток вместо только одной наиболее вероятной метки и вывести ее.Логистическая регрессия, SVM также может дать вам оценку для каждой метки, позволяя вам сделать что-то похожее.
Еще одна хитрость заключается в том, чтобы слегка возмущать вектор входных объектов и подавать его в классификатор.Повторите это несколько раз, и вы получите не одну метку вывода, а несколько.Вы можете посчитать и отсортировать их по частоте, чтобы получить несколько потенциальных ответов.Затем вы можете задать некоторые критерии отсечения, чтобы выбрать только подмножество этих меток и вернуть их пользователю.

...