Question

Python эквивалентно PHP strip_tags?

http://php.net/manual/en/function.strip-tags.php

e-satis · Answer 1 · 19 февраля 2010

В стандартной библиотеке Python такого нет. Это потому, что Python является языком общего назначения, а PHP начинал как веб-ориентированный язык.

Тем не менее, у вас есть 3 решения:

Вы спешите: просто сделайте свое. re.sub(r'<[^>]*?>', '', value) может быть быстрым и грязным решением.
Используйте стороннюю библиотеку (рекомендуется, потому что это более пуленепробиваемо): красивый суп действительно хорош, и устанавливать нечего, просто скопируйте каталог lib и импортируйте. Полный туто с красивым супом .
Используйте рамки. Большинство разработчиков Web Python никогда не пишут код с нуля, они используют фреймворк, такой как django , который автоматически делает это за вас. Полный Туто с Джанго .

John La Rooy · Answer 2 · 19 февраля 2010

Использование BeautifulSoup

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(htmltext)
''.join([e for e in soup.recursiveChildGenerator() if isinstance(e,unicode)])

GoTLiuM · Answer 3 · 11 октября 2013

from bleach import clean
print clean("<strong>My Text</strong>", tags=[], strip=True, strip_comments=True)

Otto Allmendinger · Answer 4 · 19 февраля 2010

Вы не найдете много встроенных эквивалентов Python для встроенных функций HTML HTML, поскольку Python - это скорее язык сценариев общего назначения, чем язык веб-разработки.Для обработки HTML обычно рекомендуется BeautifulSoup .

Gagandeep Singh · Answer 5 · 11 сентября 2012

Для этого есть рецепт активного состояния,

http://code.activestate.com/recipes/52281/

Это старый код, поэтому вам нужно изменить парсер sgml на HTMLparser, как указано в комментариях

Вот модифицированный код,

import HTMLParser, string

class StrippingParser(HTMLParser.HTMLParser):

    # These are the HTML tags that we will leave intact
    valid_tags = ('b', 'a', 'i', 'br', 'p', 'img')

    from htmlentitydefs import entitydefs # replace entitydefs from sgmllib

    def __init__(self):
        HTMLParser.HTMLParser.__init__(self)
        self.result = ""
        self.endTagList = []

    def handle_data(self, data):
        if data:
            self.result = self.result + data

    def handle_charref(self, name):
        self.result = "%s&#%s;" % (self.result, name)

    def handle_entityref(self, name):
        if self.entitydefs.has_key(name): 
            x = ';'
        else:
            # this breaks unstandard entities that end with ';'
            x = ''
        self.result = "%s&%s%s" % (self.result, name, x)

    def handle_starttag(self, tag, attrs):
        """ Delete all tags except for legal ones """
        if tag in self.valid_tags:       
            self.result = self.result + '<' + tag
            for k, v in attrs:
                if string.lower(k[0:2]) != 'on' and string.lower(v[0:10]) != 'javascript':
                    self.result = '%s %s="%s"' % (self.result, k, v)
            endTag = '</%s>' % tag
            self.endTagList.insert(0,endTag)    
            self.result = self.result + '>'

    def handle_endtag(self, tag):
        if tag in self.valid_tags:
            self.result = "%s</%s>" % (self.result, tag)
            remTag = '</%s>' % tag
            self.endTagList.remove(remTag)

    def cleanup(self):
        """ Append missing closing tags """
        for j in range(len(self.endTagList)):
                self.result = self.result + self.endTagList[j]    


def strip(s):
    """ Strip illegal HTML tags from string s """
    parser = StrippingParser()
    parser.feed(s)
    parser.close()
    parser.cleanup()
    return parser.result

cwallenpoole · Answer 6 · 15 ноября 2011

Я построил один для Python 3, используя класс HTMLParser. Это более многословно, чем в PHP. Я назвал его классом HTMLCleaner, и вы можете найти источник здесь и примеры здесь .

Ignacio Vazquez-Abrams · Answer 7 · 19 февраля 2010

Python не имеет одной встроенной, но есть безбожное количество реализаций .

Python эквивалентно PHP strip_tags?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Python эквивалентно PHP strip_tags?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы