Невозможно разобрать неправильно отформатированный HTML - PullRequest
1 голос
/ 11 августа 2011

Вот моя программа node.js:

var jsdom = require('jsdom');

var site = 'http://www.lefigaro.fr/international/2011/08/09/01003-20110809ARTFIG00389-un-premier-mort-dans-les-emeutes-en-grande-bretagne.php';
var jquery = 'http://ajax.googleapis.com/ajax/libs/jquery/1.6.2/jquery.min.js';
jsdom.env(site, [jquery], function(error, window) {
    console.log(error);
    console.log(window.$);
});

и вывод:

/home/matt/Desktop/nodejs/node_modules/jsdom/lib/jsdom.js:245
        window.document.documentElement.appendChild(script);
                                        ^
TypeError: Cannot call method 'appendChild' of null
    at /home/matt/Desktop/nodejs/node_modules/jsdom/lib/jsdom.js:245:41
    at Array.forEach (native)
    at /home/matt/Desktop/nodejs/node_modules/jsdom/lib/jsdom.js:230:22
    at [object Object].callback (/home/matt/Desktop/nodejs/node_modules/jsdom/lib/jsdom.js:289:17)
    at [object Object].<anonymous> (/home/matt/Desktop/nodejs/node_modules/request/main.js:294:21)
    at [object Object].emit (events.js:64:17)
    at IncomingMessage.<anonymous> (/home/matt/Desktop/nodejs/node_modules/request/main.js:281:54)
    at IncomingMessage.emit (events.js:81:20)
    at HTTPParser.onMessageComplete (http.js:133:23)
    at Socket.ondata (http.js:1232:22)

Я думаю, что это не работает, потому что HTML-код со страницы источника не корректенформатированию.Это действительно из-за этого и есть ли способ исправить это, если это так?

Спасибо

1 Ответ

2 голосов
/ 11 августа 2011

Что ж, похоже, jsdom до сих пор поддерживает только DOM Level 1 и некоторые распространенные методы, предоставляемые браузером, но documentElement из спецификации DOM Level 2.

Ref:

  1. http://jsdom.org/documentation
  2. https://developer.mozilla.org/En/DOM/Document.documentElement
...