Предположим, есть только следующие переменные, связанные с музыкой: гитарные соло (имеет / не имеет), внезапные изменения тона (имеет / не имеет), вокал (имеет / не имеет, мужчина / женщина), ударные (имеет / не имеет, обычный / электронный).
Теперь давайте представим, что вы наслаждаетесь музыкой, когда в ней присутствуют гитарные соло, внезапные смены тонов, женский вокал и электронные барабаны.С другой стороны, я ценю музыку, когда в ней есть гитарные соло, внезапные изменения тона, отсутствие вокала и регулярные барабаны).
Эти предпочтения можно рассматривать как наши модели для наслаждения музыкой.
Теперь предположим, что есть песня с гитарными соло, внезапными сменами тонов, женским вокалом и электронными барабанами.Если бы мы сказали, нравится ли вам эта песня или нет, ответ был бы да, это на 100% соответствует.Но как насчет меня?Ну, я ценю 3 из 5 функций песни, так что я, вероятно, получу удовольствие.
Ответ, который мы дали выше о том, оценивать или нет песню, можно рассматривать как классификацию задачу в машинном обучении.Теперь, если бы нам пришлось сгруппировать всех по музыкальным предпочтениям и музыкальным функциям выше, мы были бы кластеризованными слушателями музыки и т. Д.
Как мы можем построить модель для чего-то?Конечно, из данных.Когда вы работаете с Weka, ваши файлы .arff содержат ваши обучающие данные, которые Weka использует, чтобы узнать о том, что изображено этими данными (в нашем примере это будет означать наши музыкальные предпочтения).
В процессе обучения создается модель, которая используется для классификации новых данных, их группировки и т. Д. Например, если мы предоставили Weka наши музыкальные предпочтения и проинструктировали его изучать наши модели с помощью байесовского классификатора, когдамы обеспечиваем его особенностями данной песни, она сможет определить, хотим ли мы эту песню или нет, и с какой вероятностью.