смещение выбора правого хвоста - PullRequest
0 голосов
/ 25 августа 2018

Есть N кандидатов, из которых нужно выбрать M (M << N), основываясь на некоторой метрике S. </p>

Я делаю следующее: Я загружаю ремень, чтобы создать L экземпляров балловдля каждого из N кандидатов, а затем взять среднее из этих L экземпляров, чтобы получить средний балл для каждого из N кандидатов;и, наконец, возьмите топ М из них в качестве окончательного выбора.

Проблема, которую я вижу, состоит в том, что производительность вне образца не так хороша, как в данных образца.Я предполагаю, что это из-за проблемы «выбора правильного хвоста».Позвольте мне объяснить - в образце я получаю некоторую оценку, а затем выбираю верхнюю N, это создает правое смещение хвоста, которое не соответствует действительности из выборки.

Есть ли байесовский взгляд на это?Любые ссылки для решения этой проблемы будут высоко оценены!Кроме того, если что-то неясно, пожалуйста, не стесняйтесь спрашивать объяснения.

...