Поиск html, возвращаемый поиском в googgle, затем сообщает результат - PullRequest
0 голосов
/ 11 января 2020

Допустим, я использую HttpClient (. net или любой эквивалентный фреймворк), чтобы отправить поисковый запрос в Google, чтобы узнать результаты лучших брендов настольных компьютеров

HttpResponseMessage response = await client.GetAsync("https://www.google.com/search?q=best+desktop+brand");

, и я получу необработанный html, скажем, есть 10 результатов, и "https://www.dell.com/" идет 3-й результат, но в необработанном html, как я могу сказать, что это 3-й результат, это любой специальный разделитель строк, который разделяет каждый результат?

1 Ответ

0 голосов
/ 11 января 2020

Вы не можете полагаться на что-либо о HTML, которое возвращается. Он предназначен для показа людям в веб-браузере, а не анализируется скриптом. Это может измениться в любое время.

Это также противоречит их TOS, и они могут заблокировать вас, если обнаружат вас.

К счастью, Google предоставляет API для программной выборки результатов поиска. Я предлагаю вам использовать его.

...