Сбор еврейских имен из группы веб-сайтов - PullRequest
0 голосов
/ 26 августа 2011

У меня есть следующий сайт (иврит): http://www.daydeals.co.il/

Содержит множество ссылок на внешние сайты. Я хочу написать сценарий jQuery, который будет 1) открыть все ссылки 2) собрать элементы со всех открытых сайтов, на которых есть текст «someText» 3) вернуть коллекцию всех элементов из (2)

Может кто-нибудь подсказать мне, как это сделать?

другой вопрос: Я попытался использовать следующий селектор jq: оповещения ($ ( "ДИВ: содержит ( 'אביב')") текст ());

однако, когда я просматриваю это в любом браузере, иврит превращается в гибриш. Есть ли способ преодолеть это?

Заранее спасибо

Ответы [ 2 ]

0 голосов
/ 16 декабря 2011

Попробуйте Web-Harvest . Идеально подходит для таких задач.

По умолчанию рабочая кодировка UTF-8, поэтому она должна работать с сайтами на иврите, если они используют UTF-8. Вы также можете определить другую кодировку в элементе <config>.

0 голосов
/ 26 августа 2011

Из-за ограничений на межсайтовый скриптинг браузер не позволит вам получить доступ к странице в другом домене через JavaScript.Вы не сможете читать или собирать данные с внешнего веб-сайта.Это можно сделать с помощью серверных сценариев, таких как PHP, Perl или Java.

У вас установлена ​​версия браузера на иврите?

...