Алгоритм распознавания пользователя - PullRequest
6 голосов
/ 21 февраля 2011

Допустим, у вас большой журнал IRC-чана, и вы хотите узнать, какой пользователь использует несколько учетных записей. В качестве входных данных у вас есть время, когда пользователь подключается к серверу, и некоторый анализ текста (частота слов и т. Д.), А в качестве выходных данных вы хотите, чтобы вероятность того, что два пользователя "совпадут".

Можно ли сделать это с помощью ANN? Есть ли лучшие алгоритмы для решения этой задачи?

PS: использование IP-адресов не является приемлемым решением:)

Ответы [ 2 ]

2 голосов
/ 21 февраля 2011

Проблема с использованием нейронных сетей заключается в том, что вам нужен надежный набор обучающих данных, то есть вам нужно иметь множество примеров людей, использующих несколько учетных записей, где вы уже знаете, что они делают.Кроме того, если люди, которых вы пытаетесь идентифицировать, когда-либо играли в ролевые игры, они, вероятно, смогут заставить себя выглядеть немного иначе, если захотят.

Так что, если людидействуя так же, как они сами и , у вас есть довольно хороший набор тренировочных данных, тогда у вас есть шанс.Вероятно, вы должны начать с методов, используемых криминалистической лингвистикой .

Но я подозреваю, что вы, вероятно, в конечном итоге будете заниматься идентификацией людей, которые похожи друг на друга.Возможно, для сайта знакомств;не так круто для большинства других вещей.(Например, я думаю, это был бы ужасный способ найти членов Anonymous в других обличьях.)

2 голосов
/ 21 февраля 2011

Эта проблема известна как «обнаружение авторства» (или, иногда, в определенной области, «обнаружение плагиата»). Это можно сделать с помощью различных статистических алгоритмов, из которых нейронные сети не самые простые.

Проверьте алгоритм Cavnar & Trenkle для классификации текста. Это может быть превращено в полезный базовый алгоритм для этой задачи. Реализации на разных языках доступны в Интернете. Возможно, вы захотите превратить его в алгоритм кластеризации вместо классификатора.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...