При использовании Beautifulsoup для извлечения текста из таблицы, я не могу извлечь текст из-за нескольких текстов в одном и том же.
Я использовал следующие коды -
results = soup.find_all('span', class_="crux-body-copy crux-body-copy--small--bold")
results[0]
Я получаю следующие результаты
<span class="crux-body-copy crux-body-copy--small--bold">
LATCH connections
<span class="product-model-tooltip">
<span aria-hidden="true" class="crux-icons crux-icons-help-information"></span>
<span class="product-model-tooltip-window">
<span aria-hidden="true" class="crux-icons crux-icons-close"></span>
<span class="crux-body-copy crux-body-copy--small--bold">LATCH connections</span>
<span class="crux-body-copy crux-body-copy--small">Type of LATCH connection.
</span>
</span>
</span>
</span>
Затем я попытался получить текст
results[0].get_text()
дает мне
'\nLATCH connections\n\n\n\n\nLATCH connections\nType of LATCH connection.\n\n\n\n'
Затем я использовал
results[0].get_text().replace('\n', '')
и я получаю
'LATCH connectionsLATCH connectionsType of LATCH connection.'
Все, что мне нужно, это «Соединения защелки» и «Тип соединения защелки» в виде двух столбцов.
Не могли бы вы помочь.