Буду очень признателен за помощь в том, чтобы дублировать или взять в среднем два набора данных:
У меня есть 2 набора данных в одном и том же производственном процессе, в то время как в одном процессе данные генерируются каждую минуту, в следующем данные процесса генерируются 10 раз в минуту. Будет ли более разумным взять среднее из большего набора данных или продублировать меньший набор, чтобы он соответствовал количеству большего набора данных. Обратите внимание, что после завершения набора данных я буду выполнять регрессионный анализ с различными моделями.