Как эффективно отслеживать общее время активности каждого пользователя в больших данных? - PullRequest
0 голосов
/ 05 октября 2018
  1. Если даны потоковые данные времени входа и выхода из системы каждого пользователя на платформе, и нам необходимо предоставить отчет об общем времени активности каждого пользователя в день.Тогда как спроектировать систему так, чтобы она могла работать в сценарии с миллионами пользовательских данных?

    При работе с данными небольшого масштаба хорошим вариантом является сохранение пар входа-выхода каждого пользователя в hashmap.Но не очень хорошо масштабируется в больших масштабах.

  2. Если некоторые детали входа в систему или выхода из системы отсутствуют, и даже не каждый поток данных отсортирован во времени, то будет то же решениеработа?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...