Моя проблема заключается в том, что мне нужны все данные в сетке, содержащей субдомены с веб-сайта https://applipedia.paloaltonetworks.com - (данные, содержащие ИМЯ, КАТЕГОРИЯ, ПОДКАТЕГОРИЯ, РИСК, ТЕХНОЛОГИЯ).Что мне нужно, это [Пример: В строке № 5: 2ch имеет 2 субдомена | _2ch-base и 2ch-posting.Таким образом, я только хочу получить список всех приложений, имеющих субдомены]
Прямо не всякий раз, когда я пытался добавить что-либо в строке:
table =wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, 'tbody#bodyScrollingTable tr')))
Я получаю ошибку тайм-аута.
Ниже приведен скрипт, который у меня есть на данный момент, который выбирает все данные из сетки, но мне нужны только приложения и они содержат субдомены. [Пример 2ch, 2ch-base, 2ch-posting].Я обнаружил шаблон с помощью элемента inspect, в котором все приложения, у которых нет поддоменов, имеют (), или мы можем перейти к полю (), которое является общим для всех приложений, имеющих поддомены.Любая помощь в решении этой проблемы будет высоко ценится.
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.Chrome(executable_path = r'/Users/am/Downloads/chromedriver')
driver.maximize_window()
driver.get("https://applipedia.paloaltonetworks.com/")
wait = WebDriverWait(driver,30)
table =wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, 'tbody#bodyScrollingTable tr')))
for tab in table:
print(tab.text)