Вопрос о новом типе доверительного интервала - PullRequest
0 голосов
/ 07 мая 2019

Я получил следующий результат, проверенный на многих наборах данных, но у меня пока нет формальных доказательств:

Теорема : ширина L любой уверенностиинтервал асимптотически равен (так как n стремится к бесконечности) степенной функции n, а именно L = A / n ^ B, где A и B - две положительные константы в зависимости от набора данных, а n - размер выборки.

Подробнее см. здесь и здесь .Показатель B, по-видимому, очень похож на показатель Херста во временных рядах не только с точки зрения того, что он представляет, но и с точки зрения значений, которые он принимает: B = 1/2 соответствует совершенным данным (без автокорреляции или нежелательно).характеристики), а B = 1 соответствует «плохим данным», как правило, с сильными автокорреляциями.

Обратите внимание, что B = 1/2 - это то, что каждый использует в настоящее время, предполагая, что наблюдения распределены независимо и одинаково, с лежащей в основе нормойраспределение.Я также разработал метод, позволяющий сделать так, чтобы ширина интервала сходилась быстрее нуля: O (1 / n), а не O (1 / SQRT (n)).Это также описано в разделе 3.3.в моей статье о повторной выборке ( здесь ), и мой подход в этом контексте кажется очень связанным с так называемыми точными интервалами второго порядка (обычно достигаемыми с помощью современных версий начальной загрузки, см. здесь .)

Мой вопрос заключается в том, является ли моя теорема оригинальной, новаторской и правильной, и как кто-то докажет ее (или опровергнет).

Пример уверенностиИнтервал

Perl-код для получения доверительных интервалов для корреляции

1 Ответ

0 голосов
/ 09 июля 2019

Первая проблема: что вы подразумеваете под доверительным интервалом?

Допустим, я делаю непараметрическую оценку функции вероятности плотности с помощью оценки плотности ядра. Интервал доверия не имеет значения в этой настройке. однако вы можете вычислить что-то, что является «скоростью» сходимости вашего оценщика плотности ядра к вашей целевой функции. В зависимости от выбора расстояния, которое вы выбираете между функциями, вы можете получить различную скорость сходимости. И, например, лучшая скорость с расстоянием $ L ^ {\ infty} $ зависит от фактора $ \ log (n) $.

Кстати, вы приводите контрпример в своей первой статье.

Так что для меня ваша теорема не может существовать по двум причинам:

  1. Непонятно, нужно точно указать, что вы подразумеваете под доверительным интервалом. Вы должны сказать, что вы подразумеваете под зависимостью от набора данных (зависит ли это от $ N $ количества наблюдений?)

  2. Существует «контрпример», поскольку асимптотическая скорость сходимости оценок может быть более сложной, чем вы говорите.

...