Проблема
Я был новичком в очистке веб-страниц и пытался создать скребок, который просматривает ссылку на список воспроизведения и получает список музыки c и автора.
Но сайт продолжал отклонять мое соединение, потому что считал меня ботом, поэтому я использовал UserAgent для создания фиктивной строки useragent, чтобы попытаться обойти фильтр.
Это сработало? Но проблема заключалась в том, что когда вы заходили на сайт через браузер, вы могли видеть содержимое списка воспроизведения, но когда вы пытались извлечь код html с запросами, содержимое списка воспроизведения было просто большим пустым пространством.
Mabye Я должен ждать загрузки страницы? Или есть более сильный бот-фильтр?
Мой код
import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
ua = UserAgent()
melon_site="http://kko.to/IU8zwNmjM"
headers = {'User-Agent' : ua.random}
result = requests.get(melon_site, headers = headers)
print(result.status_code)
src = result.content
soup = BeautifulSoup(src,'html.parser')
print(soup)
Ссылка на сайт
ссылка на плейлист
html Я получаю при использовании запросов
html с пустым пространством, где должен был быть плейлист