Какова теория алгоритмов, которая, например, генерирует предложения на сайте stackoverflow для похожих вопросов, пока вы пишете один? Не могли бы вы порекомендовать несколько книг на эту тему?
Алгоритмы, о которых вы говорите, находятся в основном в 3 AI ответвлениях: NLP , ML и IR .
Например, чтобы найти наиболее похожие 10 вопросов нового вопроса, можно извлечь n-грамм из текстов каждого вопроса, вычислить TF-IDF весовые векторы для каждого n вопроса.-грамм, затем вычислите косинусное сходство между новым вопросом и всеми остальными вопросами и выберите 10 вопросов с наибольшим сходством.
Некоторые бесплатные книги, которые вы можете прочитать: http://nlp.stanford.edu/IR-book/ http://infolab.stanford.edu/~ullman/mmds.html
И 2 бесплатных курса, начинающихся в конце января: http://www.nlp -class.org / http://jan2012.ml -class.org /
Также (вид участия): http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1
Я думаю, что это связано с правилом ассоциации майнинга , которое возникло из анализа корзины.Для справки: Web Data Mining от Bing Liu - одно из лучших.