Как уже упоминалось в других ответах crunchbase - хорошее место для получения информации такого типа, но вам потребуется браузер без головы, чтобы удалить базу данных crunchbase.
такие как селен
Если вы используете Ubuntu, установить Selenium довольно просто. Selenium требует драйвера для взаимодействия с выбранным браузером. Например, Firefox требует geckodriver
- pip install селен
- sudo pip3 установить селен --upgrade
установить последнюю версию geckodriver
Добавьте драйвер в PATH, чтобы другие инструменты могли его найти, или в каталоге, где установлено все ваше программное обеспечение, иначе это вызовет ошибку (исполняемый файл 'geckodriver' должен быть в PATH)
- MV geckodriver / usr / bin /
код
from bs4 import BeautifulSoup as BS
from selenium import webdriver
baseurl = "https://www.crunchbase.com/organization/{0}"
query = input('type company name : ').strip().lower()
url = baseurl.format(query)
driver = webdriver.Firefox()
driver.get(url)
html = driver.page_source
soup = BS(html, 'lxml')
acquiredBy = soup.find('div', class_= 'flex-no-grow cb-overflow-ellipsis identifier-label').text
print(acquiredBy)
Вы также можете получить другую информацию, используя ту же логику, просто проверив класс / идентификатор и извлеките информацию.