Каков наилучший способ объединить значения функций для разных моделей с одинаковыми функциями? - PullRequest
0 голосов
/ 11 декабря 2018

Я обучил 16 различных моделей на сходных наборах биологических данных, чтобы предсказать возникновение определенного заболевания (цель) из ~ 17000 биологических суперпутей (особенности).Каждый набор данных имеет одинаковые функции, но не одинаковую архитектуру модели.Кроме того, половина наборов данных представляет реальную заболеваемость (~ 5%), в то время как другая половина уравновешивается путем повторной выборки положительного класса.Существуют некоторые другие преобразования данных, которые были сделаны таким образом, чтобы каждая модель подчеркивала разные атрибуты данных.

Вот пример индекса элемента (из кадра данных по упорядоченным значениям свойств) для всех моделей инаборы данных.Эта особенность, я уверен на 100%, является важной особенностью в прогнозировании этого заболевания.Но вы можете увидеть, как это зависит от модели.Каждая строка является индексом другой модели.

Feature Index

Как и ожидалось, разные модели воспринимают разные сигналы, и они в основном имеют биохимический смысл, несмотря на то, что значения характеристик меняютсяпо существу.

Чтобы создать один простой для понимания продукт, я отобразил функции, упорядоченные по их гармоническому среднему значению индекса во всех моделях.Картинка ниже:

Feature and Harmonic Mean of Index

Как лучше показать 1 (или 2) упорядочение элементов всех 16 моделей?

* Важность функции - это просто модель модели sklearn.feature_importance_ (которая важна для Джини).

...