Я отслеживаю выживаемость продукта, используя оценку Каплана-Мейера на основе данных о доставке и возврате. На это влияют следующие факторы: тип продукта, тип оборудования и т. Д. c. Это категориальные ценности. Что-то вроде:
|-------------|-------------|-------------|-------------|-------------|---------------|
| Parameter A | Parameter B | Parameter C | ship qty | return qty | survival rate |
|-------------|-------------|-------------|-------------|-------------|---------------|
| Product 1 | x | m | 50 | 1 | survival rate |
|-------------|-------------|-------------|-------------|-------------|---------------|
| Product 1 | x | n | 40 | 2 | survival rate |
|-------------|-------------|-------------|-------------|-------------|---------------|
| Product 1 | y | m | 10 | 1 | survival rate |
|-------------|-------------|-------------|-------------|-------------|---------------|
| Product 1 | z | k | 80 | 11 | survival rate |
|-------------|-------------|-------------|-------------|-------------|---------------|
| . | . | . | . | . | survival rate |
|-------------|-------------|-------------|-------------|-------------|---------------|
Предположим, что «z» для параметра B влияет на выживаемость больше, чем другие. Как я могу определить это по этой таблице? Я ищу параметр и его значение.
Newb ie здесь для анализа выживаемости, любая помощь будет оценена по достоинству.
Изменить: я попытался построить модель для прогнозирования выживаемости оцените, но это дает мне неверные результаты.