Меня интересует проблема паттернирования майнинга среди игроков игр социальных сетей. Например, обнаружение мошенников в игре, учитывая пользовательскую базу данных компании. До сих пор я следовал обычному рецепту для проекта интеллектуального анализа данных:
- построить хранилище данных, которое собирает важную информацию
- выберите классификатор и обучите его с подсекцией записей со склада
- проверка классификатора с помощью другого набора тестов
- пена, промыть, повторить
Удивительно, но я нашел очень мало в этой области в отношении литературы, лучших практик и т. Д. Я надеюсь краудсорсировать здесь проблему сбора информации. В частности, что я ищу:
- То, что сработали классификаторы, подойдет для этого типа интеллектуального анализа паттернов (он кажется очень временным, пользователи, играющие в игры, пользователи, получающие награды, пользователи, передающие призы и т. Д.).
- Существуют ли какие-либо согласованные атрибуты, характерные для данных социальных сетей / игр?
- Какое практическое количество информации следует учитывать? Одна из проблем, с которыми я столкнулся, - это перегрузка данных, когда запросы и очистка данных могут занять несколько дней.
- Относительно пункта выше, какие аппаратные ресурсы требуются для получения результатов? Мне было трудно оценить объем вычислительной мощности, который мне потребуется для производственного использования. Стало очевидно, что белая коробка в углу не имеет достаточной мощности для такого проекта. Компании вообще прибегают к облачным решениям? Они покупают кластеры?
В принципе, любые ресурсы (теоретические, академические или практические) о реализации программы анализа социальных сетей / игровых шаблонов были бы очень благодарны.
Спасибо.