Я знаю, что существует сомнение, разрешено ли очищение LinkedIn;но из следующей статьи: https://www.forbes.com/sites/emmawoollacott/2019/09/10/linkedin-data-scraping-ruled-legal/#787286c31b54
Я думаю, можно с уверенностью сказать, что удаление общедоступных данных из LinkedIn является законным.
Теперь я пытаюсь очистить поиск работы для конкретной работы. название в конкретном регионе. Пока все хорошо, все работает, за исключением ограничения количества очищенных заданий, равного 25.
Я пытаюсь использовать следующий трюк: внутри URL я передаю ключевое слово & start = X, где X идет отОт 0 до 25, 50 и т. Д.
В браузере это позволяет мне перейти к следующему просмотру страницы и извлечь оттуда задания. Однако при использовании scrapy этот метод не работает.
Код выглядит следующим образом:
res = requests.get('https://www.linkedin.com/jobs/search/?keywords={}&location={}&start=25'.format(job, location))
response = TextResponse(res.url, body=res.text, encoding='utf-8')
print("processing:" + response.url)
Вывод:
обработка: https://www.linkedin.com/jobs/search/?keywords=Data+Scientist&location=Brussels&start=0
Даже если я жестко закодирую его в 25 (стр. 2), он установит его в 0.
Есть идеи, как это решить?