Я использую Selenium Web Driver для извлечения точек данных из профилей LinkedIn. В этом примере я хочу извлечь каждый навык из раздела навыков, но данные извлекаются в формате HTML.
При попытке преобразовать HTML-код в текст я получаю прикрепленное сообщение об ошибке.
from parsel import Selector
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
driver = webdriver.Chrome('/Users/davidcraven/Downloads/chromedriver')
# get profile URL
driver.get('https://www.linkedin.com/AnyProfileURL')
# assigning the source code for the web page to variable sel
sel = Selector(text=driver.page_source)
# get skills
skills = sel.xpath('//*[starts-with(@class, "skills searchable has-several ")]').extract()
newtext = BeautifulSoup(skills, "lxml").text
![enter image description here](https://i.stack.imgur.com/ZqXok.png)