Алгоритм, лежащий в основе метода tsfresh select_features - PullRequest
1 голос
/ 01 октября 2019

Я недавно начал использовать библиотеку tsfresh для извлечения функций из данных временных рядов.

Очень круто, что я могу получить пакет функций в несколько строк кода, но у меня есть сомнения по поводу логикиза select_features метод. Я просмотрел официальные документы и погуглил их, но не смог найти, какой алгоритм для этого используется. Я хочу знать, как это работает, чтобы я мог решить, что делать на этапе выбора функции после обработки данных в tsfresh.

1 Ответ

1 голос
/ 02 октября 2019

Согласно этой странице в своей документации, они делают следующее:

  1. они извлекают полный набор функций
  2. они индивидуально тестируют различные функциидля значимости (в контролируемой обстановке, таким образом, тест является чем-то вроде «полезна ли эта функция для прогнозирования этого результата?») и сохраняет наиболее значимые из них с помощью процедуры, называемой процедурой Бенджамини-Екутиели

Ссылки, которые они предоставляют, должны представлять интерес:

[1] Christ, M., Kempa-Liehr, AW and Feindt, M. (2016). Распределенные и параллельные временные ряды извлекают функции для промышленных приложений больших данных. Электронные издания ArXiv: 1610.07717 URL: http://adsabs.harvard.edu/abs/2016arXiv161007717C

[2] Бенджамини, Й. и Екутиели, Д. (2001). Контроль уровня ложных обнаружений при множественном тестировании в зависимости. Летопись статистики, 1165–1188

, где [1] - документ, описывающий tsfresh, а [2] - ссылку для процедуры множественного тестирования (называемой выше процедурой Бенджамини-Екутиели).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...