Можно ли проанализировать веб-страницу со стороны клиента на наличие большого количества слов, и если да, то как? - PullRequest
0 голосов
/ 21 мая 2010

У меня есть список ключевых слов, около 25 000 из них. Мне бы хотелось, чтобы люди, добавившие определенный тег на свою веб-страницу, преобразовали эти ключевые слова в ссылки. Каков наилучший способ достичь этого?

Я попробовал простой подход javascript (массив с большим количеством элементов и регулярное выражение / замена каждого из них), и он явно замедляет работу браузера.

Я всегда мог бы обработать контент на стороне сервера, если бы у клиента был способ отправить контент страницы в междоменный серверный скрипт (я неравнодушен к PHP, но это может быть что угодно), но я не не знаю, как это сделать.

Любое другое рабочее решение также приветствуется.

1 Ответ

0 голосов
/ 21 мая 2010

Я бы позволил удаленному сайту добавить файл javascript и использовать ajax connect для вашего сайта, чтобы получить список только определенных терминов.Какие термины?

  • Категории: Теперь, если это для рекламы (где эта концепция была проделана много раз), позвольте им указать, к какой категории относится их сайт, и сгруппируйте ваши термины по этим категориям.Тогда только отправьте эти группы терминов.В их интересах было бы выбрать правильные категории, потому что чем больше у них ссылок, тем больший доход они могут генерировать.

  • Индексирование: если это не сработает, возможно, когдав первый раз, когда кто-то пытается загрузить страницу, на вашем сервере индексируйте ее копию и индексируйте все слова на своей странице в соответствии с имеющимися у вас терминами, а для любых последующих загрузок у вас есть список терминов для их отправки на основе того, что их страницасодержит.в идеале после этого у вас должен быть какой-то фоновый процесс, который индексирует их страницы с помощью вашего скрипта, как раз в день или каждые несколько дней, чтобы перехватывать какие-либо обновления.Возможно, используйте скрипт, чтобы получить хэш содержимого страницы, и если он вообще будет изменен, вы можете обновить свою индексированную копию.

Я уверен, что есть другие методы, которые лучше всегона самом деле просто предпочтение.Попробуйте взглянуть на несколько других сайтов / сценариев с рекламными ссылками и посмотреть, как они это делают.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...