Beautifulsoup Href либо скрыто, либо не работает - PullRequest
0 голосов
/ 08 марта 2020

Я пытаюсь извлечь текст, помеченный желтым цветом из этого изображения -

Изображение здесь

Я перепробовал все коды, доступные для извлечения ссылки, например, Я использовал такие коды, как -

links = [a.get('href') for a in soup.find_all('a', { "id" : "price-and-shop-body" }, href=True)]
links

Ничего не работает.

У вас есть решение?

1 Ответ

0 голосов
/ 08 марта 2020

Вы пытаетесь разобрать текст с изображения, которое вообще невозможно с помощью BeautifulSoup. Вы можете использовать BeautifulSoup для анализа веб-страниц, а не для изображений.

Однако вы можете использовать pytesseract , который является python библиотекой для оптического распознавания символов (OCR). Этот блог может вам помочь.

...