У меня есть большой фрейм данных с числами, соответствующими значению ошибки. Как мне найти, какие числа в наборе соответствуют нижним RMSE значениям?
Фрейм данных, который у меня есть:
rmse nodes
1 1.866433 [1, 6, 39, 20, 36, 3, 23, 40, 33, 26]
2 2.023630 [23, 41, 4, 28, 32, 9, 7, 34, 3, 20]
3 2.051780 [17, 11, 3, 41, 20, 19, 5, 21, 36, 8]
4 2.082243 [20, 3, 2, 6, 10, 4, 41, 8, 17, 15]
5 2.087589 [11, 21, 9, 13, 20, 5, 3, 41, 7, 12]
6 2.101199 [27, 3, 1, 39, 7, 5, 20, 9, 14, 36]
7 2.107429 [1, 22, 10, 11, 21, 20, 18, 3, 41, 6]
8 2.109857 [22, 20, 37, 3, 31, 1, 5, 6, 0, 8]
9 2.119020 [20, 31, 14, 25, 34, 4, 9, 3, 7, 41]
...
...
На первый взгляд кажется что не существует реальной схемы, в которой числа появляются в списках с более низкими значениями RMSE. Я попытался построить распределение плотности наиболее эффективных строк чисел, но это еще не дало никаких сведений. Код, который создает этот график:
df['nodes'].iloc[0:100].apply(lambda x:pd.Series(x)).plot.kde()
Кто-нибудь знает какие-то техники?