Тестирование на гетероскедастичность и автокорреляцию в больших несбалансированных данных панели - PullRequest
0 голосов
/ 26 апреля 2018

Я хочу проверить гетероскедастичность и автокорреляцию в большом несбалансированном наборе данных панели.

Я использую следующий код:

* Heteroskedasticity test

// iterated GLS with only heteroskedasticity produces 
// maximum-likelihood parameter estimates

xtgls adjusted_volume ibn.rounded_time i.id i.TRD_EVENT_DT, igls panels(heteroskedastic)
estimates store hetero 

* Autocorrelation

findit xtserial
net sj 3-2 st0039
net install st0039

xtserial adjusted_volume ibn.rounded_time i.id i.TRD_EVENT_DT

Несмотря на то, что я использую вычислительные возможности высокопроцентного центра, из-за итерационного метода эта процедура занимает более 15 часов.

Какая программа наиболее эффективна для выполнения этих тестов с использованием Stata?

1 Ответ

0 голосов
/ 27 апреля 2018

Этот вопрос не имеет отношения к теме и довольно широк, но я подозреваю, что значительный интерес для новых пользователей. Таким образом, здесь я постараюсь закрепить наши Разговор в комментариях как ответ.

Я настоятельно советую в будущем воздерживаться от использования весьма субъективных такие слова, как «лучший», которые могут означать разные вещи для разных людей. Или же такие термины, как «эффективный», которые могут иметь различное значение в другом контексте. Также сложно дать конкретный совет относительно использования команд когда мы ничего не знаем о том, что вы пытаетесь сделать.

На мой взгляд, «лучший» выбор - это выбор, который выполняет работу с такой же точностью насколько возможно, учитывая имеющиеся данные. Скорость является важным фактором в наше время, но точность по-прежнему является самой фундаментальной. Продолжая использовать Stata, вы увидите, что она имеет значительное количество команд, часто с перекрывающимися функциями. В зависимости от варианта использования, иногда выбор одной реализации перед другой может быть «лучше» в том смысле, что он может быть более практичным или более быстрым в достижении желаемого конечного результата.

Например, ваш комментарий в предыдущем посте , где опция noconstant недоступна в rreg. В этом конкретном контексте вы можете получить достаточно хорошую альтернативу, используя regress с опцией vce(robust). Фактически, эта альтернатива часто может быть достаточной для нескольких случаев использования.

В этом конкретном примере xtgls будет значительно быстрее, если igls опция не используется. Это будет особенно верно для больших и более «сложных» наборов данных. В случаях, когда MLE необходим, опция iterate позволит вам указать фиксированное количество итераций, что может ускорить процесс, но может стать причиной катастрофы, если вы не знаете, что делаете, и поэтому не рекомендуется , Эта опция обычно используется для других целей. Однако является ли xtgls единственной командой, которую вы можете использовать? Прочитайте здесь , почему это на самом деле не обязательно так.

Что касается скорости, Stata в целом медленный, по крайней мере, когда используется язык ado. Это потому, что это интерпретируемый язык. Единственный реалистичный вариант увеличения скорости - через parallelisation, если у вас есть Stata MP. Даже в этом случае, будет ли достигнут какой-либо выигрыш, это будет зависеть от ряда факторов, включая какую команду вы используете.

Наконец, xtserial - это команда сообщества , которую вы не прояснить в вашем вопросе. Это обычно и полезно, чтобы обеспечить это информация с самого начала, чтобы другие знали, что вы не ссылаетесь на официальная, встроенная команда.

...