Удалить символы из элементов в списках, которые находятся внутри списка - PullRequest
0 голосов
/ 10 октября 2018

У меня список выглядит как ниже.Я получил список от соскобов, и мне нужно избавиться от этих <h5> & </h5>.Есть ли способ сделать это или сделать это на ходу во время очистки?

[[<h5>Tomato Street Grill</h5>, <h5>Go Live</h5>, <h5>Bistro</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>], [<h5>Tomato Street Grill</h5>, <h5>Go Live</h5>, <h5>Bistro</h5>, <h5>Starch Bar</h5>, <h5>Saucey</h5>, <h5>Pacific Fusion</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>], [<h5>Tomato Street Grill</h5>, <h5>Bistro</h5>, <h5>Go Live</h5>, <h5>Saucey</h5>, <h5>Pacific Fusion</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>], [<h5>Tomato Street Grill</h5>, <h5>Go Live</h5>, <h5>Saucey</h5>, <h5>Fresh Inspirations</h5>, <h5>Harvest Bakery</h5>]]

Ps: я пытался сделать что-то вроде find_next_siblings('h5').text и python, что я получил до того, как .text является списком, поэтому я не могу извлечь текст таким способом.

Pps: тип каждого подсписка - bs4.element.ResultSet, а тип каждого наименьшего элемента - bs4.element.Tag.

1 Ответ

0 голосов
/ 11 октября 2018
for sublist in main_list:
    for ele in sublist:
        ele = ele.get_text()
        ele.replace('<h5>', '')
        ele.replace('</h5>', '')

Это пройдёт по основному списку, затем итерирует подсписки, затем удалит ненужные теги h5 из подсписков.Надеюсь, это поможет.

Правка, поскольку это красивые суповые объекты, вам нужно вызвать метод text, есть несколько способов сделать это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...