Question

У меня список выглядит как ниже.Я получил список от соскобов, и мне нужно избавиться от этих <h5> & </h5>.Есть ли способ сделать это или сделать это на ходу во время очистки?

[[<h5>Tomato Street Grill</h5>, <h5>Go Live</h5>, <h5>Bistro</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>], [<h5>Tomato Street Grill</h5>, <h5>Go Live</h5>, <h5>Bistro</h5>, <h5>Starch Bar</h5>, <h5>Saucey</h5>, <h5>Pacific Fusion</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>], [<h5>Tomato Street Grill</h5>, <h5>Bistro</h5>, <h5>Go Live</h5>, <h5>Saucey</h5>, <h5>Pacific Fusion</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>], [<h5>Tomato Street Grill</h5>, <h5>Go Live</h5>, <h5>Saucey</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>]]

Ps: я пытался сделать что-то вроде find_next_siblings('h5').text и python, что я получил до того, как .text является списком, поэтому я не могу извлечь текст таким способом.

Pps: тип каждого подсписка - bs4.element.ResultSet, а тип каждого наименьшего элемента - bs4.element.Tag.

Theodore Howell · Answer 1 · 11 октября 2018

for sublist in main_list:
    for ele in sublist:
        ele = ele.get_text()
        ele.replace('<h5>', '')
        ele.replace('</h5>', '')

Это пройдёт по основному списку, затем итерирует подсписки, затем удалит ненужные теги h5 из подсписков.Надеюсь, это поможет.

Правка, поскольку это красивые суповые объекты, вам нужно вызвать метод text, есть несколько способов сделать это.

Удалить символы из элементов в списках, которые находятся внутри списка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Удалить символы из элементов в списках, которые находятся внутри списка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов