Как мне определить предмет данной веб-страницы? Подобно тому, что делает Ad Sense - PullRequest
2 голосов
/ 04 марта 2010

Мне нужно выяснить, о чем идет речь.Что-то вроде того, что делает Google AdSense.

Например, если у меня есть веб-страница о собаках, мне нужно выяснить, что эта страница посвящена (сторонним сайтам) собакам, поэтому я могу предложить услуги по выгула собак.*

Могу ли я обратиться к базе данных Google или что-то подобное.

1 Ответ

0 голосов
/ 16 июля 2011

Это один из святых Граалей Семантической Паутины. Там нет ни одного ответа. Вы можете очистить HTML (например, с помощью Python - Beautiful Soup) и отправить текст в OpenCalais для анализа.

Это не та задача, которую вы хотите выполнить в свободное время - используйте чужую работу. Oz

...