Как использовать начальную модель Google для классификации наборов данных последовательностей ДНК или белка? - PullRequest
1 голос
/ 08 марта 2020

Я пытался классифицировать белок, используя его последовательности, в их семейства. Могу ли я использовать для этой цели глубоко сверточные модели, даже если они используют входные метрики RGB 3 изображения? Существует ли какой-либо конкретный c способ преобразования набора данных, кроме изображения, для классификации с использованием этих моделей. Я новичок в искусственных нейронных сетях, ваши предложения очень ценятся.

1 Ответ

0 голосов
/ 08 марта 2020

Во-первых, вы должны понять, что перед имеющимися у вас моделями стоит очень сложная задача: Object Recognition на цветных изображениях, поэтому используемые модели очень большие. Затем вам нужно знать, что цель использования CNN - извлечь как можно больше функций из цветных изображений для обнаружения.

С учетом вышеизложенного я думаю, что classifying protein using its sequences кажется достижимым при более маленькая сверточная модель. Вам может понадобиться при max 10 слоев свертки. В заключение, вам не нужен CNN, такой же сложный, как google inception model.

О ваших данных. Нет никаких правил в отношении CNN, согласно которым вы можете использовать только изображения RGB. Эти картинки только массивы. Если у вас есть какие-либо числовые данные c, которые можно использовать в алгоритмах c операций, конечно, вы можете использовать CNN для извлечения признаков. Я рекомендую вам взглянуть на этот пример.

Я также рекомендую вам взглянуть на следующие библиотеки. SK-LEARN, KERAS и PYTORCH. Эти библиотеки очень удобны для начинающих, и у них есть удивительные документальные фильмы.

Удачи.

...