Извлечение метаданных с сайта - PullRequest
1 голос
/ 16 июня 2011

Мне было интересно, есть ли способ в javascript, который позволяет мне обрабатывать html исходный код, который позволяет мне извлекать определенные теги, которые я хочу?

Извините, если это звучит просто или слишком просто. я новичок в программировании.

Ответы [ 2 ]

0 голосов
/ 16 июня 2011

Если у вас есть HTML в строке, вы можете использовать:

var str = '<html></html>'; // your html text goes here
var div = document.createElement('div');
div.innerHTML = str;
var dom = div.firstChild; // dom is the object you want,
                          // you can manipulate it using standard dom methods

В качестве альтернативы, используйте jQuery.jQuery - это библиотека, которая поможет вам более легко манипулировать и получать доступ к элементам HTML.Сначала добавьте это в заголовок вашего документа:

<script type="text/javascript" src="https://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js"></script>

Это ссылка на библиотеку jQuery.Затем выполните:

var foo = $("<html>Your html here</html>");

Или, если ваш html находится в переменной (например, str), вы можете сделать:

var foo = $(str);

Затем вы можете манипулировать и анализировать foo вколичество способов.Например, чтобы удалить все элементы абзаца, вы должны использовать

foo.remove('p');

Или, чтобы удалить элемент абзаца с id = "bar", используйте:

foo.remove('p.bar');

Как только вы закончитеваши изменения, вы можете получить новый текст HTML, используя:

foo.html();

Почему ваш HTML в строке?Разве это не HTML-код текущей страницы?

0 голосов
/ 16 июня 2011

Использование DOM позволяет получать данные с веб-страниц, если вы знаете структуру.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...