Я думаю, что эти данные показывают линейность, потому что люди будут вступать в брак по мере взросления. Таким образом, он может быть представлен линейным уравнением.
В основном, это может быть решено с помощью линейной регрессионной модели машинного обучения.
Я думаю, что вы делаете какую-то модель машинного обучения.
Во всяком случае, это пример кода, который я рассчитываю каждое среднее значение семейного положения.
data = [[38, 'Soltero'],
[26, 'Casado'],
[26, 'Soltero'],
[38, 'Soltero'],
[24, 'Soltero'],
[28, 'Soltero'],
[30, 'Casado'],
[19, 'Soltero'],
[28, 'Soltero'],
[45, 'Casado'],
[27, 'Soltero'],
[41, 'Casado'],
[45, 'Casado'],
[38, 'Soltero']]
df_edad_estado_civil = pd.DataFrame(data, columns=list(['Estado_Civil', 'Edad']))
result = df_edad_estado_civil['Estado_Civil'].groupby(df_edad_estado_civil['Edad']).mean()
print (df_edad_estado_civil)
print (result)
Результат:
Estado_Civil Edad
0 38 Soltero
1 26 Casado
2 26 Soltero
3 38 Soltero
4 24 Soltero
5 28 Soltero
6 30 Casado
7 19 Soltero
8 28 Soltero
9 45 Casado
10 27 Soltero
11 41 Casado
12 45 Casado
13 38 Soltero
Edad
Casado 37.400000
Soltero 29.555556