Если даны потоковые данные времени входа и выхода из системы каждого пользователя на платформе, и нам необходимо предоставить отчет об общем времени активности каждого пользователя в день.Тогда как спроектировать систему так, чтобы она могла работать в сценарии с миллионами пользовательских данных?
При работе с данными небольшого масштаба хорошим вариантом является сохранение пар входа-выхода каждого пользователя в hashmap.Но не очень хорошо масштабируется в больших масштабах.