Я пытаюсь получить таблицу с веб-страницы с помощью веб-драйвера Selenium. Сначала я захожу на веб-страницу, затем перехожу на веб-страницу с таблицей.
Проблема в том, что в таблице нет тегов td
, а исходный код веб-страницы выглядит следующим образом:
![enter image description here](https://i.stack.imgur.com/cf8GF.png)
C# код:
using OpenQA.Selenium;
using OpenQA.Selenium.Chrome;
using System;
using System.Collections.Generic;
namespace Table_Scrape
{
class Program
{
static void Main(string[] args)
{
IWebDriver driver = new ChromeDriver();
driver.Navigate().GoToUrl("https://website.com/login");
driver.FindElement(By.Id("username")).SendKeys("MYusername");
driver.FindElement(By.Id("password")).SendKeys("MYpassword");
driver.FindElement(By.Id("btnSubmit_6")).Click();
driver.FindElement(By.Id("btnContinue")).Click();
driver.Navigate().GoToUrl("https://website.com/table");
IList<IWebElement> allElement = driver.FindElements(By.TagName("td"));
foreach (IWebElement element in allElement)
{
string cellText = element.Text;
Console.WriteLine(cellText);
}
}
}
}
У кого-нибудь есть предложения по извлечению данных с веб-страницы?
Структура таблицы то же самое для каждого ряда. Столбцы похожи на slick-cell 10 r0
, slick-cell 10 r1
et c.
РЕДАКТИРОВАТЬ:
Консольный вывод:
DevTools listening on ws://xxxx:xxx/devtools/browser/0a02f6b7-3c33-41ea-b0b3-fb67d3f436c7
[1583946337.939][WARNING]: Timed out connecting to Chrome, retrying...
[1583946340.587][SEVERE]: Timed out receiving message from renderer: 0.100
[1583946343.800][SEVERE]: Timed out receiving message from renderer: 0.100
[1583946343.903][SEVERE]: Timed out receiving message from renderer: 0.100
[1583946344.024][SEVERE]: Timed out receiving message from renderer: 0.100
[1583946345.482][SEVERE]: Timed out receiving message from renderer: 0.100
[1583946345.583][SEVERE]: Timed out receiving message from renderer: 0.100
[1583946347.170][SEVERE]: Timed out receiving message from renderer: 0.100