У меня сейчас проблема с заданием.
Мы анализируем данные трендов YT, которые структурированы на следующие
У нас есть наблюдения в строке и такие вещи, как идентификатор видео, идентификатор категории, заголовок, дата изменения и т. Д. В столбцах.
Задача состоит в том, чтобы сохранить самые последние наблюдения за video_id (у видео иногда несколько дней в тенденциях, и нам нужно только самое последнее наблюдение (строка).
Я попробовал это до сих пор с:
newDataframe <- aggregate(trending_date ~ video_id, data=df, FUN=max)
Несмотря на то, что он выполнил работу, у меня нет других переменных, ожидающих дату тренда и идентификатор, который мне нужен, поэтому я подумал о том, чтобы связать его со старым? фрейм данных, но я понятия не имею, как я должен это сделать, не имея нежелательных старых наблюдений.
Я очень ценю любую помощь!