Мне нужно собрать данные с этой веб-страницы: http://www.mlsa.am/?page_id=368. Это раскрывающийся список, в котором можно выбрать следующие варианты: регионы, районы, сообщества, тип субсидии, месяц и год. После выбора этих опций появляется таблица с информацией о жителях этих мест, которые получают различные виды субсидий. Трудности, с которыми я сталкиваюсь в то время, чтобы разобраться с этим, состоят в том, что поле «Области» зависит от того, какой «Регион» я выбираю, а «Сообщества» зависят от них обоих. Вот как выглядит веб-страница, когда я ее проверяю, эта информация принадлежит ячейке «Регионы» (первый вариант):
`<!--Մարզեր-->
<div class="td-pb-row">
<div class="td-pb-span2"></div>
<div class="td-pb-span5">
Մարզեր <span class="ben-required">*</span>
<select id="ref_regions_id" name="ref_regions" style="border:1px solid #0790A2;" >
<option value="0" > Ընտրել </option>
<option value="1"> ԱՐԱԳԱԾՈՏՆ</option>`
<option value="2"> ԱՐԱՐԱՏ</option>
<option value="3"> ԱՐՄԱՎԻՐ</option>
<option value="4"> ԳԵՂԱՐՔՈՒՆԻՔ</option>
<option value="5"> ԼՈՌԻ</option>
<option value="6"> ԿՈՏԱՅՔ</option>
<option value="7"> ՇԻՐԱԿ</option>
<option value="8"> ՍՅՈՒՆԻՔ</option>
<option value="9"> ՎԱՅՈՑ ՁՈՐ</option>
<option value="10"> ՏԱՎՈՒՇ</option>
<option value="11"> ԵՐԵՎԱՆ</option>`
</select>
</div>
Я использую селен с python, и пока это мой код:
`import time
import requests
from selenium import webdriver
from selenium.common.exceptions import WebDriverException
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.keys import Keys
chrome_path = r"C:\Users\ivrav\selenium-2.25.0\Driver\chromedriver.exe"
driver = webdriver.Chrome(chrome_path)
print("loading url into browser...")
def get_all_pages():
payload={'value':'1'}
driver.get("http://www.mlsa.am/?page_id=368")
print(url.text)
time.sleep(2)`