Как я могу кластеризовать набор запросов с начальным и конечным временем? - PullRequest
0 голосов
/ 07 ноября 2019

Мне дан набор запросов q_1, q_2, ..., q_m. Запрос q_i для любого 1 <= i <= m может быть выполнен несколько раз в разное время. Мне также даны время начала и окончания любого выполнения запроса q_i. </p>

Учитывая приведенную выше информацию, я заинтересован в кластеризации запросов, так что кластер состоит из набора запросов, которые «часто»выполняется в течение некоторого промежутка времени или расстояния. Как показано на следующем рисунке, для примера нам дано 5 запросов с временными окнами их выполнения.

A set of 5 queries and their execution time windows

Возможный алгоритм кластеризации выдает следующий результат.

Resulting clusters

Какие алгоритмы кластеризации вы порекомендуете для моей проблемы?

1 Ответ

0 голосов
/ 07 ноября 2019

Извлечение соответствующих функций.

Например, длительность, частота, кратность.

Далее определите функцию подобия для количественно , какие запросы похожи.

Затем выберите алгоритм, основанный на этом.

...