Возможно, я подхожу к этому совершенно неправильно, но в настоящее время у меня есть функция, показанная ниже, которая получает ссылку на первое видео на YouTube, которое I появляется в результатах поиска, при условии ввода строки:
def searchYTLink(title):
query = urllib.parse.quote(title)
url = "https://www.youtube.com/results?search_query=" + query
response = urllib.request.urlopen(url)
html = response.read()
soup = BeautifulSoup(html, 'html.parser')
result = soup.findAll(attrs={'class': 'yt-uix-tile-link'})[0]
return 'https://www.youtube.com' + result['href']
Теперь я хочу ввести список строк для этой функции и сопоставить его со всеми моими рабочими узлами. Чтобы добиться этого, я написал код ниже:
# Make sure that you initialize the Sppark Context
sc = SparkContext(appName="MusicClassifier")
searchTest = ['videoa', 'videob', ...]
sc.parallelize(searchTest).map(searchYTLink)
Это правильный способ сделать это?