Очистка текстовых данных с отметками времени из сгенерированного окна чата - PullRequest
0 голосов
/ 31 августа 2018

Я хочу удалить данные чата из клипа Twitch. Это как сохраненный клип в прямом эфире, где вы можете увидеть, как люди отреагировали в тот момент. Мы можем взять это как пример:

https://clips.twitch.tv/BenevolentPunchyLyrebirdMingLee

Итак, я могу получить все данные, если посмотрю видео до конца, используя селекторы запросов. Однако я хочу написать скребок, который получает ссылку на клип и выводит необработанные текстовые данные с отметками времени.

Я искал API Twitch.com, но в клипах ничего нет.

1 Ответ

0 голосов
/ 12 марта 2019

В конце концов, я создал этот маленький скрипт на Python, чтобы получить данные чата для данного клипа Twitch.

По-видимому, вы можете получить данные чата для данного видео с помощью вызова API: https://api.twitch.tv/v5/videos/$VODID/comments?cursor=$NEXT

где vodid - идентификатор видео клипа, а курсор работает так:

вы можете получить данные чата в чанках, и у каждого чанка есть значение курсора, которое указывает следующий чанк. Таким образом, вы можете продолжать получать следующий фрагмент до тех пор, пока не найдете смещение, в котором совпадает смещение клипа, и записываете / сохраняете данные чата до тех пор, пока они не уменьшат продолжительность клипа.

Если кому-то это нужно:

https://github.com/OgulcanCelik/twitch-clip-chat

...