Я хотел бы использовать отрицательную логарифмическую вероятность в качестве целевой функции для моделирования примерно гауссовых данных с правильной цензурой.Моя целевая функция будет выглядеть примерно так, но я не уверен, как определить стандартное отклонение, используемое для расчета.Обычно мы просто минимизируем RMSE для максимальной вероятности Гаусса, а стандартное отклонение сводится к некоторой константе, которую мы можем спокойно игнорировать.При расчете вероятности с цензурированными данными с использованием 1 - CDF не ясно, что стандартное отклонение не имеет значения.Безопасно ли здесь просто использовать стандартное отклонение переменной отклика в качестве стандартного отклонения?
Я действительно не хочу моделировать, используя индекс соответствия, и я предпочел бы использовать непараметрические методы, а нечем простые модели пропорциональных рисков Кокса.
import numpy as np
from scipy.stats import norm
def censored_nll(event, value, prediction, std_dev):
if event:
return -np.log(norm.pdf(value, prediction, std_dev))
return -np.log(norm.sf(value, prediction, std_dev))