Вопросы о re.findall () - PullRequest
       54

Вопросы о re.findall ()

0 голосов
/ 06 ноября 2019

Я хотел бы получить URL-адрес лучших результатов поиска на YouTube. Я пытаюсь re.findall (), однако, при печати заголовков видео, он возвращает дубликаты и список видео, которые, кажется, не в порядке. Также хотелось бы найти только плейлисты. Я знаю, что смогу отсортировать по ключевым словам, как только у меня заработает re.findall (), однако мне было интересно, смогу ли я изменить свои параметры в функции. Я попытался добавить & список после идентификатора видео, но это, похоже, тоже не работает.

import urllib.request
import urllib.parse
import re

word = "ed sheeran playlist"
query_string = urllib.parse.urlencode({"search_query" : word})
html_content = urllib.request.urlopen("http://www.youtube.com/results?" + query_string)
search_results = re.findall(r'href=\"\/watch\?v=(.{11})',    html_content.read().decode())
i =0
while True:
    url = "http://www.youtube.com/watch?v=" + search_results[i]
    video = pafy.new(url)
    print(video.title)
    i = i+1
...