В чем разница между машинным обучением и статистикой? - PullRequest
9 голосов
/ 17 ноября 2010

в лекции Тьюринга 2010 Кристофер Бишоп говорит о том, что машинное обучение переживает революцию, потому что статистика применяется к алгоритмам машинного обучения ...

, но затемкак и все алгоритмы машинного обучения, все статистические алгоритмы ... в чем реальная разница между ними?почему они являются отдельными курсами в большинстве университетов?

Ответы [ 7 ]

10 голосов
/ 17 ноября 2010

Статистика все основывает на вероятностных моделях. Типичный анализ начинается с предположения, что ваши данные являются выборками из случайной величины с некоторым распределением, а затем делается вывод о параметрах распределения.

Машинное обучение может использовать вероятностные модели, а когда оно используется, оно перекрывается со статистикой. Но машинное обучение не так предано вероятности. Он также хочет использовать другие подходы к решению проблем, не основанные на вероятности.

9 голосов
/ 17 ноября 2010

Между этими двумя нет большой разницы, и то, что есть, в основном культурное.Машинное обучение происходит от корней информатики, тогда как статистика более математична.Есть хорошая запись в блоге под названием «Статистика против машинного обучения, сражайтесь!» от Брендана О'Коннора, в которой говорится об этом.

Что касается нестатистических подходов к машинному обучению, то есть несколько подходов, основанных на правилах (деревья решений, индукция правил, ILP), и есть также такие подходы, как обучение с подкреплением для задач управления.Те не чувствуют очень статистически для меня, но вы могли бы утверждать, что они ... вы, вероятно, могли бы утверждать, что вся жизнь подпадает под статистическую теорию принятия решений, если вы хотите (на самом деле, МаркусХаттер делает).

1 голос
/ 08 марта 2014

Я вижу некоторые важные различия:

# Область применения : Машинное обучение использует статистические модели, но оно также использует другие модели, такие как динамическое программирование, обучение с подкреплением, методы, которые пришли из искусственногоИнтеллект или оптимизация.

# Точка зрения : Статистика обычно связана со свойствами оценщиков (непредвзятость, асимптотическое поведение), а машинное обучение в основном связано с решением реальных проблем..

# Поле Reasearch : хотя статистику можно рассматривать как подполе прикладной математики, машинное обучение можно рассматривать как подполе информатики.

# Разработка и применение кода : Хотя люди, работающие со статистикой, обычно предпочитают R (или SAS, STATA, EVIEWS), люди, работающие с машинным обучением, обычно выбирают Python (илидругой язык структурированного программирования)

0 голосов
/ 30 ноября 2018

В ML идея заключается в том, что вы строите отдельную модель для ситуации, когда у вас есть данные, а у вас нет данных.

Статистика, с другой стороны, сводится к хранению имеющихся у вас данных и получению наилучших результатов.

Разница в том, что философия влияет на то, как вы относитесь к выбросам. В ML вы выходите и находите достаточно выбросов, которые становятся чем-то, с чем вы действительно можете тренироваться.

С помощью статистики вы говорите: «У меня есть все данные, которые я когда-либо смогу собрать». Итак, вы выбрасываете выбросы. Это философское различие из-за сценариев, в которых используются ML и статистика.

Статистика часто используется в режиме ограниченных данных, или ML работает с большим количеством данных.

0 голосов
/ 26 августа 2017

Машинное обучение -

  • Алгоритм, который может извлекать уроки из данных, не полагаясь на программирование, основанное на правилах.

  • Подполе информатикии искусственный интеллект, который имеет дело со строительными системами, которые могут учиться на основе данных вместо явно запрограммированных инструкций.

Статистическое моделирование - это

  • Формализация отношениймежду переменными в форме математических уравнений.

  • Подполе математики, которое занимается поиском взаимосвязи между переменными для прогнозирования результата

Машинное обучениеСистема действительно является системой обучения, если она не запрограммирована для выполнения задачи, но запрограммирована на обучение выполнению задачи.Это упражнение на основе данных.Современное машинное обучение не опирается на богатый набор алгоритмических методов.Почти все приложения этой формы машинного обучения основаны на глубоких нейронных сетях.Это область, которую мы сейчас называем Глубоким обучением, специализацией машинного обучения, и часто применяется в слабых приложениях искусственного интеллекта, где машины выполняют человеческие задачи.

0 голосов
/ 03 апреля 2015

Статистика фокусируется на всех аспектах анализа данных, таких как описательный, исследовательский, логический, прогнозный и причинный. Но машинное обучение фокусируется только на прогнозном моделировании.

0 голосов
/ 07 марта 2014

Возможно, стоит отметить, что аналогичный вопрос рассматривается и обсуждается на CrossValidated

...