Question

Как автоматически найти категории для текста на основе контента?

theycallmemorty · Answer 1 · 01 июля 2009

Я бы посоветовал вам взглянуть на библиотеки классификации текста, входящие в комплект Natural Language Toolkit . Даже если вы не знакомы с Python, я думаю, вы найдете API довольно интуитивно понятным. В NLTK Book есть много хороших примеров, и люди из списка рассылки также весьма полезны.

Roberto Russo · Answer 2 · 31 декабря 2008

Чтение Интеллектуальный анализ данных: практические инструменты и методы машинного обучения - Ян Х. Виттен, Эйбе Франк
Использование Weka или Оранжевый

Annamalai N · Answer 3 · 26 апреля 2014

Самым простым способом категоризации текста является использование набора слов представления. Слова / n-граммы слов в каждом документе могут быть использованы как функции. При этом вы можете представить каждый документ как вектор в метрическом пространстве. Впоследствии вы можете применить кластеризация для группировки документов, которые похожи по содержанию. Например, вы можете использовать кластеризацию k-средних с этими векторами для кластеризации лексически похожих документов.

Инструмент для анализа текста на основе Python, NTLK отлично подходит для быстрых экспериментов с подобными задачами (в общем, Python довольно хорош для работы с текстом). Вы можете найти это полезным.

Jahangir · Answer 4 · 15 сентября 2008

Лучший способ классифицировать контент, будь то текст или мультимедиа, - это использовать таксономия . Большинство хорошо известных CMS имеют встроенную поддержку таксономии. Drupal имеет одну из лучших опций таксономии среди различных CMS.

GEOCHET · Answer 5 · 15 сентября 2008

На этом написана хорошая статья: http://www.cs.utexas.edu/users/hyukcho/classificationAlgorithm.html

Как вы классифицируете на основе текстового контента?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как вы классифицируете на основе текстового контента?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы