Использование Regex для удаления тегов HTML и амперсанда ("&) - PullRequest
0 голосов
/ 01 февраля 2019

Я извлекаю HTML-код со страницы новостей (на том же сайте) и хочу удалить с него все HTML-теги.В настоящее время все теги удалены, за исключением специальных символов (& ") и т. Д. Я просмотрел все сообщения stackoverflow и не смог найти ничего, что работает. Возможно, я так определяю функцию.

Я пытался использовать несколько различий для - item.cleanedHtml = item.PublishingPageContent.replace (/] +> / gi, '');

Но результат либо добавляет теги HTML обратно, либо не отображает текст вообще.В [] я попытался добавить "или просто &, чтобы посмотреть, поможет ли это. Я также попытался изменить всю строку, изменив другие предложения, которые я смог найти, но безрезультатно.

_blah.controller('myNewsController', ['$scope','newsService', function($scope,newsService) {
        newsService.getNews().then(function(newsItems){
            for (var i = 0; i < newsItems.length; i++) {
                var item = newsItems[i]; 
                item.cleanedHtml = item.PublishingPageContent.replace(/<\/?[^>]+>/gi, '');
                item.cleanedHtmlFun = item.cleanedHtml.replace(/"/gi, '').replace(/'/gi, '');
                item.imageUrl = getImageUrlfromSrc(item.File.Properties.PublishingPageImage,item);
            }
            $scope.news = newsItems;            
        });
    }]);

Iожидайте, что результат будет читать: Как сообщается Томом и Джерри

"То, что я получаю: Как сообщается Томом и Джерри"

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...