Question

Я хочу знать, что можно использовать для определения релевантности страницы для такой темы, как игры, фильмы и т. Д.

Есть ли какие-либо исследования в этой области или только подсчитывается, сколько раз некоторыепоявляются соответствующие слова?

Fred Foo · Answer 1 · 16 января 2012

Распространенным выбором является контролируемая классификация документов по характеристикам пакета слов (или пакета n-грамм), предпочтительно с весом tf-idf.

Популярные алгоритмы включают в себя наивные байесовские и (линейные) SVM.

Для этого подхода вам понадобятся помеченные данные обучения, т. Е. Документы с соответствующими темами.

См., Например, Введение в поиск информации , главы 13-15.

Есть ли алгоритм для определения соответствия текста теме?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Есть ли алгоритм для определения соответствия текста теме?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы