Что такое модель в интеллектуальном анализе данных? - PullRequest
0 голосов
/ 01 марта 2011
  1. Я хочу знать, что такое МОДЕЛЬ в интеллектуальном анализе данных? Кто-нибудь может это объяснить?

  2. Когда я использую Weka, я беру свои данные, выбираю метод и генерирую МОДЕЛЬ, нажимая кнопку Пуск. Может кто-нибудь объяснить, что стоит за этой моделью и как она работает после того, как я ее сгенерировал. Он использует мой выбранный метод, например, для классификации пример?

Пожалуйста, кто-нибудь может объяснить эти вещи?

Ответы [ 2 ]

3 голосов
/ 25 апреля 2011

Модель просто описывает информацию, которая используется при попытке обработки новых данных. В простом сценарии обнаружения спама алгоритм определяет, какие слова указывают на спам, а какие нет, просматривая аннотированные электронные письма. Затем списки слов формируют вашу модель.

При получении нового письма вы не будете сравнивать его с другими реальными письмами, вместо этого вы будете рассматривать слова нового письма и проверять свою модель (списки слов), независимо от того, указывают ли они на спам или нет. Вы видите, что вы становитесь независимыми от ваших обучающих данных, вместо этого у вас есть элемент знаний, который пытается моделировать всю реальность "спам против не спама".

0 голосов
/ 05 декабря 2013

Предположим, есть только следующие переменные, связанные с музыкой: гитарные соло (имеет / не имеет), внезапные изменения тона (имеет / не имеет), вокал (имеет / не имеет, мужчина / женщина), ударные (имеет / не имеет, обычный / электронный).

Теперь давайте представим, что вы наслаждаетесь музыкой, когда в ней присутствуют гитарные соло, внезапные смены тонов, женский вокал и электронные барабаны.С другой стороны, я ценю музыку, когда в ней есть гитарные соло, внезапные изменения тона, отсутствие вокала и регулярные барабаны).

Эти предпочтения можно рассматривать как наши модели для наслаждения музыкой.

Теперь предположим, что есть песня с гитарными соло, внезапными сменами тонов, женским вокалом и электронными барабанами.Если бы мы сказали, нравится ли вам эта песня или нет, ответ был бы да, это на 100% соответствует.Но как насчет меня?Ну, я ценю 3 из 5 функций песни, так что я, вероятно, получу удовольствие.

Ответ, который мы дали выше о том, оценивать или нет песню, можно рассматривать как классификацию задачу в машинном обучении.Теперь, если бы нам пришлось сгруппировать всех по музыкальным предпочтениям и музыкальным функциям выше, мы были бы кластеризованными слушателями музыки и т. Д.

Как мы можем построить модель для чего-то?Конечно, из данных.Когда вы работаете с Weka, ваши файлы .arff содержат ваши обучающие данные, которые Weka использует, чтобы узнать о том, что изображено этими данными (в нашем примере это будет означать наши музыкальные предпочтения).

В процессе обучения создается модель, которая используется для классификации новых данных, их группировки и т. Д. Например, если мы предоставили Weka наши музыкальные предпочтения и проинструктировали его изучать наши модели с помощью байесовского классификатора, когдамы обеспечиваем его особенностями данной песни, она сможет определить, хотим ли мы эту песню или нет, и с какой вероятностью.

...