Python Бакетинг (биннинг) и скользящее среднее - PullRequest
0 голосов
/ 05 августа 2020

Mov ie Таблица Команда: ужас, реальность (строка) id: 23556,86455 (int) Дата запуска: 2017-09-08, 2019-02-21 (datetime)

Feature ** ID; ** 86455,23553 (int) Watch_Time : 75,2,20,4 (минут) (float) ** Рейтинг: ** 9,5 (int)

I есть две таблицы (три столбца и две строки). Это единственные данные, которые у меня есть. Этот набор данных составляет около 10 м строк, но у меня нет набора данных. Мне нужно использовать только образцы данных, делать предположения и писать коды python.

Я хочу разделить watch_time на «длинные» / «короткие» сегменты и метки, в которые попадает каждый фрагмент контента, и текущее среднее значение для каждого из этих сегментов.

Стоит ли мне сначала присоединиться к двум таблицам перед разделением?

Любая python помощь кода очень ценится!

...