Я пытаюсь очистить текст из контейнера, но не могу понять, как очистить его.
Этот код предназначен для скребка, который извлекает три столбца для каждой записи с веб-страницы, отформатированной следующим образом:
<td class="EP">1</td>
</tr>
<tr class="EG">
<td>
</td>
<td>
<a href="https://www.COMPANYWEBSITE/">COMPANY NAME</a>
</td>
<td DO="9999">
<div class="BN">9999</div>
<img src="https://www.IMAGE.com">
</td>
<td>
Keyword 1, Keyword 2, Keyword 3, Keyword 4
</td>
<td>New York City</td>
<td>USA</td>
Я успешно удалил ИМЯ КОМПАНИИ и BN (т. Е. 9999), но мне нужно также проанализировать каждое из ключевых слов, и вот тут у меня возникли проблемы.
Я использовал следующий код Python:
page_soup = soup(page_html, "html.parser")
TT = page_soup.findAll("tr",{"class":"EG"})
container = TT[0]
for container in TT:
company_name = container.a.text
b_n = container.div.text
keywords = container.?????
Я застрял на том, как получить ключевые слова в моем выводе. Любая помощь будет принята с благодарностью.