Я пытаюсь собрать ссылку на YouTube из URL, который у меня есть внутри xlsx - PullRequest
0 голосов
/ 23 апреля 2019

Я изучаю Python самостоятельно и у меня возникла проблема.

У меня есть URL-адреса постов сайта, на котором публикуются видео на YouTube с текстами песен.

В коде Iя ломаю голову, использую openpyxl для загрузки таблицы, получаю значение строки и пытаюсь загрузить python и перейти за видеокод, чтобы правильно смонтировать URL с youtube.

Но я не могу смонтировать содержимое.

Это мое первоначальное сомнение, потому что возник другой вопрос, как заставить python выполнять весь этот процесс для всех остальных строк, одну за другой.

import lxml.html
from requests import get
from ast import literal_eval
from openpyxl import load_workbook


wb = load_workbook('Vagalume - Resultados.xlsx')
ws = wb['Table1']

result = ws['A2'].value

def main():
    youtube_prefix = 'https://www.youtube.com/watch?v='

    root = lxml.html.fromstring(result.content)
    element = root.xpath('//div[@id="artBody"]/div/a/button')

    list_values = element[0].values()
    to_dict = literal_eval(list_values[1])[0]

    video_id = to_dict['source'].split(',')[0]
    youtube_url = '{}{}'.format(youtube_prefix, video_id)

    print(youtube_url)


if __name__ == '__main__':
    main()

Это тест с использованием только одного поста без использования xlsx

import lxml.html
from requests import get
from ast import literal_eval


def main():
    youtube_prefix = 'https://www.youtube.com/watch?v='

    result = get('https://www.vagalume.com.br/lady-gaga/shallow-with-bradley-cooper.html')

    root = lxml.html.fromstring(result.content)
    element = root.xpath('//div[@id="artBody"]/div/a/button')

    list_values = element[0].values()
    to_dict = literal_eval(list_values[1])[0]

    video_id = to_dict['source'].split(',')[0]
    youtube_url = '{}{}'.format(youtube_prefix, video_id)

    print(youtube_url)


if __name__ == '__main__':
    main()
...