Обучение без учителя - PullRequest
       63

Обучение без учителя

0 голосов
/ 15 сентября 2018

Я работаю над проектом последнего года, который должен быть закодирован с использованием обучения без учителя (алгоритм KMeans).Это предсказать подходящую игру из различных игр относительно их уровней познавательных способностей.Навыки - это концентрация, время отклика, запоминание и внимание.

Первая проблема - я не могу найти правильный набор данных, содержащий навыки и игры.Тогда я не уверен, как найти кластеры.Есть ли какие-либо возможные способы узнать правильный набор данных и как их кластеризовать?

Кроме того, как я могу сделать это без набора данных (без использования обучения с подкреплением)?

Заранее спасибо

1 Ответ

0 голосов
/ 17 сентября 2018

Прежде всего, я немного запутался в вашем вопросе.Но я постараюсь ответить наилучшим образом.Кластеризация K-средних - это неконтролируемый метод кластеризации, основанный на расстоянии (обычно евклидовом) данных друг от друга.Точки данных с аналогичными функциями будут располагаться на более близком расстоянии, а затем будут сгруппированы в один кластер.

Я предполагаю, что вы пытаетесь создать алгоритм, который выводит рекомендуемую игру, учитывая концентрацию людей, время отклика, запоминаниеи навыки внимания.

Первая проблема заключается в том, что я не могу найти правильный набор данных, содержащий навыки и игры.

Для набора данных вы можете буквально построить свойсобственный, который выглядит следующим образом:

tags = [игра]

features = [концентрация, время отклика, запоминание, внимание]

Labels - это 1 на вектор, где nэто количество игр.Характеристики - это вектор на 4, и каждый навык может иметь диапазон от 1 до 5, причем 5 является самым высоким.Затем заполните его вашими любимыми классическими играми.

Например, Tetris может быть вашей первой игрой, и вы добавляете ее в свой набор данных следующим образом:

label = [Tetris]

features = [5, 2, 1, 4]

Вам нужно много внимания и внимания в тетрисе, но вам не нужно хорошее время отклика, потому что блоки медленные, а вы нетнужно что-то запомнить.

Тогда я не уверен, как найти кластеры.

Сначала вы должны определить, какое расстояние вы хотите использовать, например, Манхэттен,Евклидов и т. Д. Тогда нужно определиться с количеством кластеров.Алгоритм k-средних очень прост, просто посмотрите следующее видео, чтобы узнать его: https://www.youtube.com/watch?v=_aWzGGNrcic

Кроме того, как я могу сделать это без набора данных (без использования обучения с подкреплением)?

Этот вопрос имеет смысл 0, потому что прежде всего, если у вас нет данных, как вы можете их кластеризовать?Представьте, что ваши друзья просят вас отделить все зеленые яблоки от красных.Но они никогда не давали тебе яблок ... Как ты можешь их собирать?Это невозможно.

Во-вторых, я не уверен, что вы подразумеваете под обучением подкреплению в данном случае.Обучение усилению касается агента, существующего в среде, и обучения оптимальному поведению в этой среде, чтобы максимизировать его внутреннее вознаграждение.Например, человек, идущий в казино и пытающийся заработать больше всего денег.Это не имеет ничего общего с наборами данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...