Webscraper: поддержка очистки этого контента - PullRequest
0 голосов
/ 25 мая 2020

Я несколько дней пытался очистить следующий контент, но по какой-то причине, которую я могу понять, он возвращает пустой сборщик.

Веб-сайт - это тот, который изображен на картинке, и в основном мне нужно скребком нажмите на отмеченную желтым закладку «O / U». веб-сайт

После входа он должен очистить: tab_content

Эту информацию легко извлечь, находясь внутри вкладки, но если сначала я нужно нажать на вкладку, тогда она не будет царапаться. Я попытался использовать селекторы ссылок и щелчков по элементам, но безуспешно.

Вот карта сайта, если она помогает проиллюстрировать, что я имею в виду:

{
   "_id":"fullteste2ou",
   "startUrl":[
      "https://www.oddsportal.com/soccer/england/premier-league-2018-2019/brighton-manchester-city-UFOgEYGu/"
   ],
   "selectors":[
      {
         "id":"handicap",
         "type":"SelectorText",
         "parentSelectors":[
            "rows"
         ],
         "selector":"strong",
         "multiple":false,
         "regex":"",
         "delay":0
      },
      {
         "id":"over",
         "type":"SelectorText",
         "parentSelectors":[
            "rows"
         ],
         "selector":"span:nth-of-type(3)",
         "multiple":false,
         "regex":"",
         "delay":0
      },
      {
         "id":"under",
         "type":"SelectorText",
         "parentSelectors":[
            "rows"
         ],
         "selector":"span:nth-of-type(2)",
         "multiple":false,
         "regex":"",
         "delay":0
      },
      {
         "id":"table",
         "type":"SelectorElement",
         "parentSelectors":[
            "click"
         ],
         "selector":"div#odds-data-table.bt-2",
         "multiple":false,
         "delay":0
      },
      {
         "id":"rows",
         "type":"SelectorElement",
         "parentSelectors":[
            "table"
         ],
         "selector":"div.table-header-light",
         "multiple":true,
         "delay":0
      },
      {
         "id":"click",
         "type":"SelectorElementClick",
         "parentSelectors":[
            "_root"
         ],
         "selector":"div#odds-data-table.bt-2",
         "multiple":false,
         "delay":0,
         "clickElementSelector":"a[onmousedown='uid(5)._onClick();return false;']",
         "clickType":"clickOnce",
         "discardInitialElements":"do-not-discard",
         "clickElementUniquenessType":"uniqueText"
      }
   ]
}

Заранее большое спасибо за ваше время и помощь !!!

...