Как я могу извлечь полную дату и время из Beautifulsoup ResultSet? - PullRequest
0 голосов
/ 07 августа 2020

Я пытаюсь извлечь дату и время публикации в Instagram, используя селен и beautifulsoup. Я не уверен, как извлечь элемент datetime.

from bs4 import BeautifulSoup
from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.instagram.com/p/B5LeHK2h4p0/')

html = driver.page_source
soup = BeautifulSoup(html)

dateTime= soup.select('time._1o9PC.Nzb55')

Если я напечатаю dateTime, вот что я получу:

[<time class="_1o9PC Nzb55" datetime="2019-11-22T19:20:29.000Z" title="Nov 22, 2019">November 22, 2019</time>]

также, type(dateTime) дает :

<class 'bs4.element.ResultSet'>

Как извлечь 2019-11-22T19:20:29.000Z?

1 Ответ

1 голос
/ 07 августа 2020
dateTime = soup.select('time._1o9PC.Nzb55' )[0]['datetime']

[0] Чтобы извлечь его из списка, а затем получить доступ к тегу datetime.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...