Как работает предложение stackoverflow? - PullRequest
5 голосов
/ 29 декабря 2011

Какова теория алгоритмов, которая, например, генерирует предложения на сайте stackoverflow для похожих вопросов, пока вы пишете один? Не могли бы вы порекомендовать несколько книг на эту тему?

Ответы [ 2 ]

5 голосов
/ 29 декабря 2011

Алгоритмы, о которых вы говорите, находятся в основном в 3 AI ответвлениях: NLP , ML и IR .

Например, чтобы найти наиболее похожие 10 вопросов нового вопроса, можно извлечь n-грамм из текстов каждого вопроса, вычислить TF-IDF весовые векторы для каждого n вопроса.-грамм, затем вычислите косинусное сходство между новым вопросом и всеми остальными вопросами и выберите 10 вопросов с наибольшим сходством.

Некоторые бесплатные книги, которые вы можете прочитать:
http://nlp.stanford.edu/IR-book/
http://infolab.stanford.edu/~ullman/mmds.html

И 2 бесплатных курса, начинающихся в конце января:
http://www.nlp -class.org /
http://jan2012.ml -class.org /

Также (вид участия):
http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a
http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1

1 голос
/ 10 января 2012

Я думаю, что это связано с правилом ассоциации майнинга , которое возникло из анализа корзины.Для справки: Web Data Mining от Bing Liu - одно из лучших.

...