Z балл, нормализующий r фрейм последовательно - PullRequest
0 голосов
/ 02 июля 2018

Я хотел бы нормализовать R data.frame путем вычисления z-показателя с использованием функции scale().

Однако я не уверен, является ли этот подход «предвзятым», что является финансовым термином для создания функций, которые не были бы известны или недоступны в течение анализируемого периода.

Это биржевые отчеты, и я хочу использовать эти данные для «backtest» (финансовый термин для проверки). Я хочу убедиться, что z-оценка каждого периода использует только данные, доступные до этого момента, а не среднее значение ряда и стандартное значение при вычислении z-оценки.

Кто-нибудь знает, как выполнить расчет для этого? Или есть другой подход?

1 Ответ

0 голосов
/ 02 июля 2018

Вы можете нормализовать данные или создавать новые функции, используя нормализацию, не беспокоясь о предвзятости. Это очень распространено.

Вы просто не используете для этого данные, которые не были бы доступны в анализируемом периоде.

Как и в случае с целевым кодированием или другими методами проектирования функций, вы просто создаете эти функции в обучающем подмножестве ваших исторических данных, а затем проверяете их в разделении проверки. Вы также можете рассмотреть возможность перекрестной проверки KFold.

Если вы хотите дополнить свой вопрос воспроизводимым примером, я могу вам его показать.

...