Конвертировать HTML содержимое файла в X HTML в Python - PullRequest
0 голосов
/ 13 апреля 2020

У меня есть файл html в моей корзине S3. Я загрузил содержимое файла и теперь хочу преобразовать содержимое в X HTML, используя Python. Я прочитал о библиотеке BeautifulSoup в python. Поверьте, она используется для анализа или преобразования файла в xml. Можете ли вы помочь мне с моей проблемой о том, как конвертировать мой html контент в X HTML, используя python? Я очень новичок в Python и попробовал следующий код: Пожалуйста, помогите -

try:
    # to read the content from s3
    s3 = boto3.client('s3')
    data = s3.get_object(Bucket='myBucketName', Key='myObjectKey')
    html_content = data['Body'].read()
    print("Content of file is-"+html_content)

    # to use beautifulsoup
    soup=BeautifulSoup(html_content,'lxml')
    return soup
except Exception as e:
    LOGGER.error(e)

1 Ответ

1 голос
/ 13 апреля 2020

Вы можете попробовать

try:
    # to read the content from s3
    s3 = boto3.client('s3')
    data = s3.get_object(Bucket='myBucketName', Key='myObjectKey')
    html_content = data['Body'].read()
    print("Content of file is-{}".format(html_content))

    # to use beautifulsoup
    soup=BeautifulSoup(html_content)
    return soup
except Exception as e:
    LOGGER.error(e)

Вы можете передать в BeautifulSoup строку HTML, и она будет завершена в формате X HTML. Требуется только добавить объявление X HTML DOCTYPE. .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...