Использование LIBSVM для прогнозирования подлинности пользователя - PullRequest
7 голосов
/ 10 марта 2011

Я планирую использовать LibSVM для прогнозирования подлинности пользователя в веб-приложениях.(1) Сбор данных о конкретном поведении пользователя (например, время входа в систему, IP-адрес, страна и т. Д.) (2) Использование собранных данных для обучения SVM (3) Использование данных в реальном времени для сравнения и создания выходных данных на уровне аутентичности

Может кто-нибудь сказать мне, как я могу сделать это с LibSVM?Может ли Weka помочь в решении подобных проблем?

1 Ответ

5 голосов
/ 10 марта 2011

Три шага, которые вы упомянули, представляют собой схему решения. Более подробно:

  1. Убедитесь, что вы получаете множество данных с пометкой , т. Е. Журналы поведения, помеченные как аутентичные / не аутентичные. (Без помеченных данных вы попадаете в довольно продвинутую область обучения с полууправлением или должны рассмотреть другие решения.)
  2. Разработайте ряд функций на основе данных, которые, по вашему мнению, хорошо предсказывают подлинность. Попробуйте метод и уточните его, пока он не будет работать достаточно хорошо по некоторому статистическому стандарту. Используйте десятикратную перекрестную проверку , чтобы убедиться, что вы не перегружаете.
  3. LibSVM может выдать оценку вероятности вместе с ее ответом; см. раздел 8 руководства .
...