Я пытаюсь проанализировать данные из нескольких видео на YouTube. Я понятия не имею, как использовать API YouTube или даже если это возможно с помощью этого метода. Вместо этого я использую Python 2.7 через PythonAnywhere.
Я создал класс 'Video' со многими атрибутами:
class Video:
def __init__(self, title, description, views, likes, dislikes, tags, comments...):
self.title = title
...
и очистили эти данные для тысяч видео. План состоит в том, чтобы проанализировать данные, чтобы определить среднее количество просмотров, лайков и т. Д., А также наиболее популярные слова в заголовках, описаниях ... или видео с наибольшим количеством просмотров в день (на основе даты загрузки и текущих просмотров). Я пытаюсь проанализировать много вещей.
Вопрос в том, каков наилучший способ анализа данных этого типа для получения списка из множества объектов? (или есть лучший способ, чем использовать список объектов?)
Я попытался сделать это через один цикл for
, который накапливает цифры, затем я отображаю цифры в конце.
Я также пытался использовать списочные выражения (например, print("Longest title:" + str(max([len(v.title) for v in allVids])))
.
Я обеспокоен тем, что использование таких множественных списков неэффективно и что единственный гигантский цикл for
лучше в долгосрочной перспективе, если не для удобства чтения.
Любая помощь очень ценится, и я прошу прощения за такой широкий вопрос; Я не смог найти ответ в другом месте на этом сайте.
Редактировать - Больше информации:
Я собираю данные из десяти самых популярных видео каждый день в одно и то же время. Список объектов на один день сохраняется в виде файла выбора. При анализе данных я загружал все файлы и добавлял их в один список.
Причина, по которой я ищу наиболее / более эффективный способ, заключается в том, что я использую PythonAnywhere для планирования очистки данных, и я не хочу постоянно находиться в тарпите; Мне нужно время на обработку данных.