На самом деле я новичок в разборе материала с Python Beautifulsoup4. Я соскребал этот сайт . Мне нужно Текущая цена за мил на первой странице.
Я уже провел 3 часа с этим. Пока ищу решение в интернете. Я узнал, что есть библиотека PyQT4, которая может имитировать, как веб-браузер, и загружать контент, а затем, когда загрузка будет завершена, вы сможете извлечь необходимые данные. Но я разбился.
Использовал этот подход для сбора данных в необработанном текстовом формате. Я пробовал и другие подходы.
def parseMe(url):
soup = getContent(url)
source_code = requests.get(url)
plaint_text = source_code.text
soup = BeautifulSoup(plaint_text, 'html.parser')
osrs_text = soup.find('div', class_='col-md-12 text-center')
print(osrs_text.encode('utf-8'))
Пожалуйста, посмотрите на это изображение . Я думаю, что проблема с тегами :: before и :: after. Они появляются после загрузки страницы.
Любая помощь будет высоко оценена.