Как мне соскоблить контент с нескольких сайтов? - PullRequest
0 голосов
/ 05 мая 2019

Я новичок в поиске помощи здесь, но многому научился из других постов здесь ... Вот природа того, на что я обращаюсь.

У меня есть несколько серверовгде размещаются файлы mkv / mp4 для фильмов, которые я хотел бы сопоставить с соответствующей информацией TMDB / TVDB и вывести ее в файл XML (в идеале, хотя CSV будет работать так же хорошо) ... Есть ли способ, которым я мог бы рекурсивнопросканировать каждый сервер и сопоставить заголовок в URL с информацией TMDB / TVDB, используя Python?

Итак, скажем, на сервере есть дерево каталогов, как показано ниже:

TVSeries --911 --- s01 ----- s01e01.mkv

В идеалекак python, чтобы очистить TVDB для «911 S01E01», взять заголовок шоу, TMDBID, IMDBID, год, сводку / график, Fanart, Poster, а затем вставить ссылку с сервера в эту информацию и экспортировать ее в файл XML, такой как:

    <item>
    <title>S01E01 - Pilot (1080p)</title>
    <meta>
        <content>episode</content>
        <imdb>tt7235466</imdb>
        <tvdb>337907</tvdb>
        <tvshowtitle>9-1-1</tvshowtitle>
        <title>Pilot</title>
        <premiered>2018-01-03</premiered>
        <season>1</season>
        <episode>1</episode>
    </meta>
        <link>http://webserver/tvseries/911/S01/911-S01E01.mkv</link>
        <thumbnail>w1280//nHLNnssMPqk7iBqRG1QJu5lXHbq.jpg</thumbnail>
        <fanart>fanart/original/337907-6.jpg</fanart>
    </item>

Я уверен, что это можно сделать, хотя я недостаточно хорошо разбираюсь в python, чтобы успешно писать код.У меня есть API для TMDB и TVDB ...

Заранее благодарю за помощь ...

...