Проблема состоит в том, чтобы охарактеризовать, что значит быть слишком широким, . Одним из решений является построение гистограммы (то есть функции плотности вероятности) разностей дат для координат x точек данных, а затем считать слишком широкими те различия, которые находятся, скажем, в верхней 33% (или любая другая пропорция, которую вы пожелаете).
Например, предположим, что координаты х - это годы:
1990 1995 2001 2002 2003 2010 2011 2012 2013 2017 2019
Допустим, мы рассчитываем разницу в датах в годах (мы можем выбрать любую другую единицу продолжительности). Мы рассчитываем разницу между значениями выше и строим гистограмму ниже.
Counts: 5 1 0 1 1 1 1
Diff.: 1 2 3 4 5 6 7
Теперь, если мы решим оставить отсоединенные различия в верхних 33% от гистограммы, это означает, что различия, большие или равные 5 годам, будут разъединены.