Нерегулярные интервалы - где провести черту? - PullRequest
0 голосов
/ 05 июля 2019

У меня есть линейный график (x представляет дату, y представляет количество прокатов автомобилей на эту дату), который должен быть подключен всегда, поскольку все значения действительны - всегда есть по крайней мере один прокат автомобилей на эту дату,Единственный раз, когда линия не должна быть соединена, но должна пропасть между двумя действительными значениями / точками, - это когда две последовательные даты слишком широки друг от друга.Я должен выяснить лучший алгоритм для того, что означают эти «две большие части», и, основываясь на этих датах (или что-то), установить параметр. Я не знаю всех возможных комбинаций дат, но я думаю, что они могут бытьчто-нибудь:

  • 2010 2011 2013 2018 2019 или
  • 1990 2001 2002 2012 2015 или
  • возможно что-нибудь еще

Есть листандартный способ решения этой проблемы?

1 Ответ

0 голосов
/ 05 июля 2019

Проблема состоит в том, чтобы охарактеризовать, что значит быть слишком широким, . Одним из решений является построение гистограммы (то есть функции плотности вероятности) разностей дат для координат x точек данных, а затем считать слишком широкими те различия, которые находятся, скажем, в верхней 33% (или любая другая пропорция, которую вы пожелаете).

Например, предположим, что координаты х - это годы:

1990 1995 2001 2002 2003 2010 2011 2012 2013 2017 2019

Допустим, мы рассчитываем разницу в датах в годах (мы можем выбрать любую другую единицу продолжительности). Мы рассчитываем разницу между значениями выше и строим гистограмму ниже.

Counts: 5 1 0 1 1 1 1
Diff.:  1 2 3 4 5 6 7

Теперь, если мы решим оставить отсоединенные различия в верхних 33% от гистограммы, это означает, что различия, большие или равные 5 годам, будут разъединены.

...