Принцип алгоритма НЛП - PullRequest
2 голосов
/ 09 января 2012

Я новичок в этом действительно полезном сайте вопросов и ответов, и я не очень хорошо говорю по-английски, поэтому извините за это.

Меня заинтересовал веб-проект, который, я думаю, не сложный, иэто упрощенный серфинг.

Описание алгоритма 1
Описание алгоритма 2

Этот алгоритм гарантирует, что ребенок очень прост, потому что он быстро анализирует сетьсодержание и найти соответствующую информацию.

Может кто-нибудь сказать мне, как работает этот алгоритм, что я пытался сделать что-то подобное?

На каких принципах функционирует этот алгоритм?

СПАСИБО!

Ответы [ 2 ]

1 голос
/ 09 января 2012

Я только что ответил очень похожий вопрос . В вашем конкретном случае имеет смысл вручную создать список тем , обучить его на машинном обучении на некоторых примерах, а затем, во время поиска, классифицировать каждый результат поиска для одна из тем. Таким образом вы получите результаты поиска, сгруппированные по темам.

UPD. Хорошо, пошаговая инструкция для одного из возможных способов.

Прежде всего, взгляните на мою недавнюю публикацию о вычислении сходства документов. Затем сделайте следующее:

  1. Реализуйте процедуру для вычисления сходства между двумя текстами (как описано в моем посте) или найдите что-то похожее.
  2. Создайте несколько коллекций документов, по одной для каждой категории (темы), которую вы хотите использовать (продукты питания, информационные технологии, политика, медицина и т. Д.).
  3. Вычисляет общий вектор всех документов в каждой коллекции.
  4. Когда пользователь выполняет поиск, вычисляет вектор для каждого найденного вами результата.
  5. Классифицируйте каждый результат в категорию с наиболее похожим общим вектором.
  6. Группировка результатов по вычисленной категории.
0 голосов
/ 25 апреля 2015

НЛП для меня, это программа, которая смотрит на необработанный текст и помечает его.

Я смотрю на это таким образом, потому что хочу использовать его в качестве тренера (самоконтроль) для ГА, которое хрюкает словами, если вы записываете, что пользователь говорит ему в цепочке марков, так что вы можете использовать столько процессорной мощности, сколько вы хотите, чтобы ускорить мутацию.

Заметьте, я еще этого не сделал, но я думаю, что идея классная, хакерская и, похоже, будет работать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...