У меня есть образец HTML в переменной html_doc, например:
html_doc = """<table class="sample">
<tbody>
<tr class="title"><td colspan="2">Info</td></tr>
<tr>
<td class="light">Time</td>
<td>01/01/1970, 00:00:00</td>
</tr>
<td class="highlight">URL</td>
<td>https://test.com</td>
</tr>
</tbody>
</table>"""
Использование Javascript довольно просто, если я хочу проанализировать DOM.Но если я хочу получить ТОЛЬКО URL (https://test.com)
и Time (01/01/1970, 00:00:00)
в 2 разных переменных из тега <td>
выше, как я могу это сделать, если с ним не связано имя класса.
Mytest.py
файл
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,'html.parser')
test = soup.find_all("td")
print(test)