Очистка - довольно трудоемкая задача,
Требуется много времени, чтобы получить данные, и даже больше, чтобы обработать данные.
Итак, чтобы сделать хороший сайтСоскоб состоит в том, что вы должны определить некоторые фоновые задачи, выполняющие работу, в то время как пользователи могут сделать что-то еще или увидеть панель процесса.
Также не все веб-сайты отображаются на стороне сервера, поэтому вы не можете получить данные страницыс запросами или другими подобными библиотеками.Вы можете использовать селен, чтобы открыть страницу в браузере (Firefox и Chrome), отобразить полную страницу и затем передать исходный код библиотекам, таким как BS, чтобы извлечь нужный контент.
Поэтому я рекомендую:
для создания представления для запроса URL-адреса страницы,
Создание одной или нескольких фоновых задач для выполнения тяжелой работы (например, с сельдереем)
, а затем передать результат пользователю после завершения процесса.
Именованные библиотеки можно найти здесь:
Селен
Сельдерей