Извлечь данные с веб-сайта в winforms c# - PullRequest
0 голосов
/ 30 мая 2020

Я хочу извлечь некоторые данные с веб-сайта. fe (https://www.chefkoch.de/rezepte/drucken/512261146932016/Annas-Rouladen-mit-Seidenkloessen.html). Текст слева и таблица ингредиентов справа.

Я пробовал несколько способов, например, с веб-клиентом, и регулярное выражение частей, но проблема заключалась в том, что если таблица имеет более одного списка, как в моем примере, я не могу их разделить.

Я также попробовал это с htmldocument и получил элементы, но у элементов нет идентификатора; только класс.

так есть ли способ убрать эти две вещи с веб-сайта? я тоже довольно новенький html и все такое ..

1 Ответ

0 голосов
/ 30 мая 2020

Вам следует подумать об использовании какой-нибудь библиотеки для очистки веб-страниц, например https://ironsoftware.com/csharp/webscraper/ или Selenium. Таким образом вы сможете настроить таргетинг на элементы HTML и классы css (для извлечения данных).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...