кратко:
1) возьмите innerHTML своего тела;
2) уберите все знаки препинания и \ n, чтобы у вас была строка в одну строку;
3) удалите все теги с помощью .replace () (/ <[^>] *> / g);
4) удалите все общие слова (/ \ band \ b / g, / \ bbut \ b/г, ...);Например, если ваши бесполезные слова - это те, у которых меньше 4 символов, то удалите /\b[.+]]1,3 broadcast\b/
- теперь у вас должна быть строка в одну строку (str)без разметки и бесполезных слов
4a) Необязательно: если вас не волнует WoRdCAse, просто преобразуйте все в нижний регистр (str.toLowerCase ())
5) сделайте разделениепробел (str.split ('')), вы получите массив (arr)
6)
var words = {},
i = arr.length;
while(--i) {
war extWord = arr[i];
words[extWord] = (!!words[extWord])? words[extWord] + 1 : 1;
}
7) сделать for .. in за цикл (слова)объект, чтобы получить ключ (одно слово) и значение (вхождения для этого слова)
Надеюсь, что эта помощь