HTML Agility Pack, как вы можете найти определенные части текста - PullRequest
2 голосов
/ 21 мая 2019

Я пытаюсь получить несколько переменных с веб-сайта, и их встречается около 30. У меня проблема в том, что я не знаю, как искать и копировать определенные части html, потому что html содержит все элементы в одной строке, и мне нужно получить

имя (и значение) высота (значение) ширина (значение) URL (значение)

и мне нужно связать высоту и ширину, а затем найти имя и найти ссылку

тогда нужно сохранить ссылку на компьютер. У меня работает класс div

перепробовал несколько наборов узлов и использовал регулярные выражения (регулярные выражения плохо для HTML)

            var url = "https://sketchfab.com/3d-models/steyr-aug-a3-4cea993b9f0d47c6b1beed7877b17447";

            using (HttpClient client = new HttpClient())
            {
                using (HttpResponseMessage response = client.GetAsync(url).Result)
                {
                    using (HttpContent content = response.Content)
                    {
                        string result = content.ReadAsStringAsync().Result;
                        System.IO.File.WriteAllText(Application.StartupPath + "rip.html", result);
                    }
                }
            }


            var path = Application.StartupPath + "rip.html";

            var doc = new HtmlAgilityPack.HtmlDocument();
            doc.Load(path);

            var node = doc.DocumentNode.SelectNodes("//div[@class='dom-data-container']");

Я не уверен, как искать, скажем

имя или что мне нужно, чтобы посмотреть файл, который я анализирую, здесь https://hastebin.com/igavulogax.js

и хочет разобрать имя и получить значение ширина и получить значение высота и получить значение и URL-адрес значения URL, а затем сохранить материал из изображения URL с использованием значения имени в качестве имени для изображения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...