Во-первых, вы должны понять, что перед имеющимися у вас моделями стоит очень сложная задача: Object Recognition
на цветных изображениях, поэтому используемые модели очень большие. Затем вам нужно знать, что цель использования CNN - извлечь как можно больше функций из цветных изображений для обнаружения.
С учетом вышеизложенного я думаю, что classifying protein using its sequences
кажется достижимым при более маленькая сверточная модель. Вам может понадобиться при max 10 слоев свертки. В заключение, вам не нужен CNN, такой же сложный, как google inception model
.
О ваших данных. Нет никаких правил в отношении CNN, согласно которым вы можете использовать только изображения RGB. Эти картинки только массивы. Если у вас есть какие-либо числовые данные c, которые можно использовать в алгоритмах c операций, конечно, вы можете использовать CNN для извлечения признаков. Я рекомендую вам взглянуть на этот пример.
Я также рекомендую вам взглянуть на следующие библиотеки. SK-LEARN
, KERAS
и PYTORCH
. Эти библиотеки очень удобны для начинающих, и у них есть удивительные документальные фильмы.
Удачи.