Как определить записи, которые имеют кластеры или куски в данных? - PullRequest
0 голосов
/ 09 мая 2019

У меня есть таблица таблиц следующим образом:

Tableau Table

Эти данные можно визуализировать следующим образом:

Tableau Visual

Я бы хотел отметить случаи, у которых есть комки / скопления. Это пометит пункты B, C и D, потому что есть всплески только в определенные недели из 13 недель. Элементы A и E не будут помечены, поскольку они в основном имеют «плоский» профиль.

Как я могу создать такой флаг в Таблице или SQL, чтобы изолировать такой случай?

Что я пробовал до сих пор ?: Я пробовал логику, где для каждого элемента я вычисляю МАКС и МЕДИАН Элементы, которые необходимо пометить, будут иметь большее (MAX - MEDIAN) значение, чем элементы, которые имеют довольно «плоский» профиль.

Пожалуйста, дайте мне знать, если есть лучший способ создать этот флаг.

Спасибо!

1 Ответ

0 голосов
/ 10 мая 2019

Согласитесь с другими комментаторами, что на этот вопрос можно ответить разными способами, и вам может потребоваться докторская степень в статистике, чтобы найти идеальный ответ.Однако, учитывая ваши основные требования, это может быть самое простое / простое решение, которое вы можете реализовать.

Answer

Вот что я сделал, чтобы получить здесь:

  1. Создайте параметр, чтобы определить свой «шип».Если это будет всегда фиксированное число, вы можете жестко закодировать его в своих формулах.Я назвал min «Min Spike Value».

  2. Создайте формулу для Медианных значений в каждом сегменте.{fixed [Buckets]: MEDIAN([Values])}.(A, B, ... E = "Ведра").Это дает вам одно значение для каждой буквы / сегмента, с которым вы можете сравнить.

  3. Создайте формулу для расчета разности каждого числа по отношению к медиане.abs(sum([Values])-sum([Median Values])).Здесь мы используем абсолютное значение, потому что шип может быть как отрицательным, так и положительным (опять же, если вы хотите определить его таким образом ...).Я назвал это «Разница между текущим значением и абсолютным значением»

  4. Создайте вычисляемое поле, которое оценивается как логическое значение, чтобы увидеть, превышает ли текущее значение пороговое значение для пика.[Spike to Current Value abs difference] > min([Min Spike Value])

Настройте визу, чтобы использовать этот логический тип для выделения шипов.Прелесть параметра в том, что вы можете изменить значение того, каким должен быть шип, и он будет выделен соответствующим образом.Выше значения было 4, но если вы измените его на 8:

Spike of 8

...