Python статьи выскабливания извлекают форму времени Article.publish_date - PullRequest
0 голосов
/ 01 ноября 2019

Python Web Scraping, из опубликованной даты, как извлечь время? Пример: POSTED 14:45, 30 ДЕКАБРЯ 2013 , ПО CNN WIRE

сверху, как извлечь время 2: 42 вечера

питон

from newspaper import Article
url = 'http://fox13now.com/2013/12/30/new-year-new-laws-obamacare-pot-guns-and-drones/'
article = Article(url)
article.download()
article.html
article.parse()
article.publish_date
article.nlp()

1 Ответ

0 голосов
/ 04 ноября 2019

Использовать BeautifulSoup ::

from bs4 import BeautifulSoup
import requests 

url = 'http://fox13now.com/2013/12/30/new-year-new-laws-obamacare-pot-guns-and-drones/'

temp = requests.get(url).text

temp=BeautifulSoup(temp, "lxml")
header = temp.find('div',{'class':"entry-meta clearfix"})
date = header.find('span').text


print(date)

Выход:

Posted 2:42 pm, December 30, 2013, by CNN Wire
[Finished in 2.8s]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...