Предположим, у меня есть данные, как указано ниже.
11:00 user1 Brush
11: 05AM user1 Prep Brakfast
11: 10AM user1 завтракает
11: 15:00 пользователь1 Принять ванну
11: 30:00 пользователь1 Уйти в офис
12 вечера пользователь2 Кисть
12: 05 вечера пользователь2 Подготовка Brakfast
12: 22:00пользователь2 завтракает
12: 15 вечера пользователь2 принимает ванну
12: 30 вечера пользователь2 уходит в офис
11 утра пользователь3 принимает ванну
11: 05 утра пользователь3 готовит завтрак
11: 10 утра пользователь3 Кисть
11: 15 утра пользователь3 ест завтрак
11: 30 утра пользователь3 Уходит в офис
12 вечера пользователь4 Принимайте ванну
12: 05PM пользователь4 Prep Brakfast
12: 10PM user4 Кисть
12: 15PM пользователь4 завтракает
12: 30PM пользователь4 Отъезд в офис
Эти данные говорят мне о распорядке дня разных людей.Из этих данных кажется, что user1 и user2 ведут себя одинаково (хотя есть разница во времени, когда они выполняют действие, но они следуют той же последовательности).По той же причине, User3 и User4 ведут себя одинаково.Теперь я должен сгруппировать таких пользователей в разные группы.В этом примере group1 - user1 и USer2 ..., за которым следует group2, включая user3 и user4
Как мне подходить к такой ситуации.Я пытаюсь изучить интеллектуальный анализ данных, и это пример, который я считаю проблемой интеллектуального анализа данных.Я пытаюсь найти подход к решению, но я не могу придумать одно.Я считаю, что эти данные имеют образец.но я не могу думать о подходе, который может выявить это.Кроме того, я должен сопоставить этот подход с имеющимся у меня набором данных, который довольно большой, но похожий на этот :) Данные относятся к журналам, в которых указано, что события происходят одновременно.И я хочу найти группы, представляющие сходную последовательность событий.
Любые указатели будут оценены.