Машинное обучение, лучшая техника - PullRequest
5 голосов
/ 26 марта 2011

Я новичок в машинном обучении.Я знаком с SVM, нейронными сетями и GA.Я хотел бы знать лучшую технику, чтобы изучить для классификации изображений и аудио.SVM делает достойную работу, но занимает много времени.Кто-нибудь знает быстрее и лучше?Также я хотел бы знать самую быструю библиотеку для SVM.

Ответы [ 7 ]

4 голосов
/ 26 марта 2011

Ваш вопрос хороший, и он связан с современным уровнем алгоритмов классификации, как вы говорите, выбор классификатора зависит от ваших данных, в случае изображений я могу сказать, что это один из методов, называемый Ada-Boost, прочитайте this и this , чтобы узнать больше об этом, с другой стороны, вы можете найти множество людей, которые проводят исследования, например, 1005 * Гендерная классификация лиц с использованием Adaboost [Родриго Верше, Хавьер Руис-дель-Солар и Маурисио Корреа] говорят:

«Adaboost-mLBP превосходит все другие методы на основе Adaboost, а также базовые методы (SVM, PCA и PCA + SVM)» Посмотрите на это.

2 голосов
/ 05 декабря 2011

, если количество функций велико по сравнению с количеством обучающих примеров, тогда вам следует перейти к логистической регрессии или SVM без ядра

, если количество функций мало, а количество обучающих примеров -промежуточный, тогда вы должны использовать SVN с гауссовым ядром

, если количество функций невелико, а количество обучающих примеров велико, использовать логистическую регрессию или SVM без ядер.-класс.

2 голосов
/ 30 марта 2011

Если ваша основная задача - скорость, вам, вероятно, стоит взглянуть на VW и вообще на алгоритмы стохастического градиентного спуска для обучения SVM.

1 голос
/ 28 апреля 2015

Метод в основном зависит от проблемы. Не существует метода, который всегда был бы самым быстрым для любой проблемы. Сказав это, вы также должны иметь в виду, что, выбрав алгоритм скорости, вы начнете идти на компромисс с точностью.

Например, поскольку вы пытаетесь классифицировать изображения, может быть много функций по сравнению с количеством обучающих образцов на руках. В таких случаях, если вы выберете SVM с ядрами, вы можете оказаться слишком подходящим, если дисперсия слишком велика. Таким образом, вы хотели бы выбрать метод, который имеет высокое смещение и низкую дисперсию. Использование логистической регрессии или линейного SVM - вот несколько способов сделать это.

Вы также можете использовать различные типы регуляризации или методы, такие как SVD, чтобы удалить функции, которые не вносят большой вклад в ваше выходное предсказание и имеют только самые важные. Другими словами, выберите функции, которые имеют небольшую или никакую корреляцию между ними. Как только вы сделаете это, вы сможете ускорить выполнение ваших SVM-алгоритмов, не жертвуя точностью.

Надеюсь, это поможет.

1 голос
/ 11 июня 2011

Я думаю, что извлечение и выбор функции очень важны.

Для классификации изображений существует множество функций, таких как необработанные пиксели, SIFT , цвет, текстура и т. Д. Было бы лучше выбрать подходящий для вашей задачи.

Я не знаком с классификацией звука, но могут быть некоторые особенности спектра, такие как преобразование Фурье сигнала, MFCC .

Методы, используемые для классификации, также важны. Помимо методов, о которых идет речь, KNN также является разумным выбором.

На самом деле, использование того, какой признак и метод тесно связаны с задачей.

1 голос
/ 03 апреля 2011

Для такой задачи вам может понадобиться сначала извлечь функции.Только после этого возможна классификация.

0 голосов
/ 11 мая 2018

Есть несколько хороших техник в обучающих машинах, таких как, повышение и Adaboost. Одним из методов классификации является метод повышения. Этот метод будет итеративно манипулировать данными, которые затем будут классифицироваться определенным базовым классификатором на каждой итерации, что, в свою очередь, создаст модель классификации. Повышение использует взвешивание каждой информации в каждой итерации, где ее весовое значение будет изменяться в зависимости от уровня сложности данных, которые будут классифицироваться. В то время как метод adaBoost является одним из методов ансамбля с использованием экспоненциальной функции функции потерь для повышения точности сделанного прогноза.

...