Найдите шаблон в списке чисел и значение ошибки - PullRequest
0 голосов
/ 09 июля 2020

У меня есть большой фрейм данных с числами, соответствующими значению ошибки. Как мне найти, какие числа в наборе соответствуют нижним RMSE значениям?

Фрейм данных, который у меня есть:

    rmse        nodes
1   1.866433    [1, 6, 39, 20, 36, 3, 23, 40, 33, 26]
2   2.023630    [23, 41, 4, 28, 32, 9, 7, 34, 3, 20]
3   2.051780    [17, 11, 3, 41, 20, 19, 5, 21, 36, 8]
4   2.082243    [20, 3, 2, 6, 10, 4, 41, 8, 17, 15]
5   2.087589    [11, 21, 9, 13, 20, 5, 3, 41, 7, 12]
6   2.101199    [27, 3, 1, 39, 7, 5, 20, 9, 14, 36]
7   2.107429    [1, 22, 10, 11, 21, 20, 18, 3, 41, 6]
8   2.109857    [22, 20, 37, 3, 31, 1, 5, 6, 0, 8]
9   2.119020    [20, 31, 14, 25, 34, 4, 9, 3, 7, 41]
...
...

На первый взгляд кажется что не существует реальной схемы, в которой числа появляются в списках с более низкими значениями RMSE. Я попытался построить распределение плотности наиболее эффективных строк чисел, но это еще не дало никаких сведений. Код, который создает этот график:

df['nodes'].iloc[0:100].apply(lambda x:pd.Series(x)).plot.kde()

Кто-нибудь знает какие-то техники?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...