В чем разница между классификатором линейной регрессии и линейной регрессией для извлечения конфиденциального интервала? - PullRequest
0 голосов
/ 01 февраля 2019

Я новичок в машинном обучении.Я хочу использовать линейную регрессию временных рядов для извлечения конфиденциального интервала из моего набора данных.Мне не нужно использовать линейную регрессию в качестве классификатора.Во-первых, в чем разница между этими двумя случаями?Во-вторых, в Python, есть ли другой способ их реализации?

1 Ответ

0 голосов
/ 01 февраля 2019

Основным отличием является то, что классификатор будет вычислять вероятности относительно метки.Регрессия вычислит количественный результат.Как правило, классификатор используется для вычисления вероятности метки, а регрессия часто используется для вычисления количества.Например, если вы хотите вычислить цену квартиры с учетом некоторых критериев, вы будете использовать регрессию, если вы хотите вычислить метку (роскошную, скромную, ...) для той же квартиры с учетом некоторых критериев, вы будете использовать классификатор.Но использование регрессий для вычисления порога для отдельных наблюдаемых меток также часто используется.Это случай линейного SVM, который вычисляет границу между метками.Это называется граница принятия решения.Предупреждение, главный недостаток линейного режима - это линейность: это означает, что граница должна быть прямой линией для разделения меток.Иногда это достаточно хорошо, иногда нет.Логистическая регрессия является исключением, потому что она вычисляет вероятность на самом деле.Его название вводит в заблуждение.

Для регрессии, когда вы хотите вычислить количественный результат, вы можете использовать доверительный интервал, чтобы иметь представление об ошибке.В классификации нет доверительного интервала, даже если вы используете линейный SVM, он не имеет смысла.Вы можете использовать функцию принятия решения, но ее трудно интерпретировать в действительности, или использовать прогнозируемые вероятности и проверить количество раз, когда метка неверна, и вычислить коэффициент ошибки.Существуют многочисленные коэффициенты, доступные с учетом вашей проблемы, и фактически это тема всей книги.

В любом случае, если вы вычисляете временные ряды, насколько я знаю, ваша цель - получить количественныйвывод, то вам не нужен классификатор, как вы сказали.А его извлечение полностью зависит от объекта, который вы использовали для его вычисления в python: это означает, что это зависит от доступных атрибутов используемого объекта.Тогда зависит от библиотеки тоже.Поэтому было бы лучше ответить вам, если вы укажете, какие библиотеки и объекты вы используете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...