Как определить, говорит ли предложение о конкретной теме? - PullRequest
1 голос
/ 15 июня 2011

У меня есть предопределенные слова, и я хотел бы знать, относится ли основная тема предложения к предопределенным словам.

Пример:

Предопределенные слова: iPhone, Nexus, HTC

Приговор:

Мне нравится новый дизайн iPhone - основной предмет - iPhone

Я перечисляю Nirvana на моем Nexus.- основной предмет не задан заранее

Телефон HTC лучше iPhone - основной предмет HTC

Я хотел бы сделать это на PHP или что-то еще, что может иметь интерфейс PHP.

Ответы [ 3 ]

0 голосов
/ 15 июня 2011

Alias-i имеет синтаксический анализатор естественного языка для PHP .

Редактировать: на этой странице говорится, что парсер Alias-i написан на PHP, а на сайте Alias-i написано на Java.

0 голосов
/ 16 июня 2011

Попытайтесь получить эвристику Гугла и оцените их.Примеры: 1. Ключевое слово в начале предложения.2. В тексте только одно ключевое слово.3. Существуют ли континуальные формы, такие как «линининг» и т. Д., Обычно приводящие к субъективному / неинформативному сообщению.

Напишите классификатор по этим признакам.Я бы порекомендовал Маллет.

0 голосов
/ 15 июня 2011

Краткая версия: По ключевым словам.

Этот метод работает только с ограниченным набором ключевых слов.

Смежный вопрос может быть: Использование preg_match для поиска всех слов в списке

Длинная версия: парсинг языка и понимание его компьютерной системой.

Позднее это то, что делают лингвисты. Они разрабатывают такие системы, и это занимает годы. Возможно, вы найдете несколько доступных реализаций, но я не знаю ничего из памяти. Нужно было бы спросить друга.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...