Для этого можно использовать объект XMLHttpRequest . Вот простой пример
var req = new XMLHttpRequest();
req.open('GET', 'http://www.mydomain.com/', false);
req.send(null);
if(req.status == 200)
dump(req.responseText);
После загрузки вы можете выполнить синтаксический анализ / извлечение с помощью регулярных выражений javascript в члене req.responseText.
Подробнее ...
На практике вам нужно сделать немного больше, чтобы получить объект XMLHttpRequest кросс-платформенным способом, например ::
var ua = navigator.userAgent.toLowerCase();
if (!window.ActiveXObject)
req = new XMLHttpRequest();
else if (ua.indexOf('msie 5') == -1)
req = new ActiveXObject("Msxml2.XMLHTTP");
else
req = new ActiveXObject("Microsoft.XMLHTTP");
Или использовать библиотеку ...
В качестве альтернативы, вы можете сэкономить на себе и просто использовать библиотеку, например jQuery или Prototype , чтобы позаботиться об этом за вас.
Политика того же происхождения может вас укусить, хотя ...
Обратите внимание, что из-за политики с тем же происхождением запрашиваемая страница должна принадлежать тому же домену, что и страница, выполняющая запрос. Если вы хотите запросить удаленную страницу, вам нужно будет передать ее через сценарий на стороне сервера.
Другой возможный обходной путь - использование Flash для выполнения запроса, который разрешает междоменные запросы, если целевой сайт предоставляет разрешение с соответствующим образом настроенным файлом crossdomain.xml.
Вот хорошая статья на тему политики того же происхождения: