Я пытаюсь собрать информацию об отслеживании на сайте грузоотправителя с помощью Beautifulsoup. Тем не менее, формат HTML не способствует тому, что я пытаюсь сделать. В исходном тексте есть лишние пробелы, которые загромождают мой вывод. В идеале я хотел бы просто взять здесь дату, но я возьму «Отправлено» и дату в этой точке, если она находится на одной строке.
Я пытался использовать. replace(" ","")
& .strip()
безуспешно.
Python Script:
from bs4 import BeautifulSoup
import requests
TrackList = ["658744424"]
for TrackNum in TrackList:
source = requests.get('https://track.xpoweb.com/en-us/ltl-shipment/'+TrackNum+"/").text
soup = BeautifulSoup(source, 'lxml')
ShipDate = soup.find('p', class_="Track-meter-itemLabel text--center").text
print(ShipDate)
HTML Исходный код:
<p class="Track-meter-itemLabel text--center">
<strong class="text--bold">
Shipped
</strong>
5/23/2019
</p>
Это то, что возвращается. Дополнительные пробелы и пустые строки.
Shipped
5/23/2019