Я думаю, что я понял функцию активации softmax для общего использования (как в обычной нейронной сети), но если после активации сверточного слоя в керасе применяется слой активации softmax, что это делает?какое значение нормализуется?
Контекст:
У меня есть набор последовательностей ДНК (состоящих из ATGC) длиной 5400 каждая.Я преобразовал его в «изображение» размером 5400 x 4 x 1 путем горячего кодирования ATGC.Целью этой модели является классификация средних 5000 последовательностей из всех 5400 последовательностей по 3 классам (то есть 0,1 и 2).Остаток последовательности 400 на самом деле является просто фланкирующей последовательностью (200 слева и 200 справа), которая может повлиять на результат прогнозирования (мы не можем опустить фланкирующую последовательность, поскольку она будет способствовать точности прогнозирования, как указано в документе.что я читаю).Следовательно, выходная форма должна быть 5000 x 3 x 1, где 5000 обозначает интересующую нас последовательность 5000, а 3 - это выходной класс с горячим кодированием (т. Е. 0,1 и 2).Это входные данные, которые я собираюсь ввести в модель.
(Примечание: предположим, что форма выражается в виде строк x столбцов x глубины)
Если нам удастся построить модель, результат прогнозирования модели даст нам вероятность каждогопоследовательность находится в каждом из 3 классов (т.е. каждая строка будет считывать вероятность того, что эта конкретная последовательность будет в классе 0, 1 и 2).Поэтому нам как-то понадобится функция, подобная softmax, чтобы нормализовать значение для каждой строки, чтобы дать разумный вывод.
Я не спрашиваю, как именно это сделать, но в статье утверждается, что это удалось сделать,применение функции softmax для последнего сверточного слоя.Но я не уверен, работает ли он на керасах или нет, потому что в статье не упоминается пакет, который они используют для построения модели.
Ссылка:
https://www.cell.com/cell/pdf/S0092-8674(18)31629-5.pdf (Просто прочитайте часть после Справки о деталях метода.)
Вот утверждение, в котором они утверждают, что используют функцию softmax для своей сверточной единицы:
Полная архитектура SpliceAIпредставлены на рисунке S1.Архитектуры состоят из K уложенных остаточных блоков, соединяющих входной уровень с предпоследним уровнем, и сверточного блока с активацией softmax, соединяющего предпоследний уровень с выходным уровнем.
Здесь прилагается полная архитектура модели ML. Архитектура SpliceAI
Извинения за ложную грамматику или использование слова.Спасибо.