Существует множество инструментов для предсказания сигнальных пептидов. Я бы использовал их в первую очередь. Большинство сигнальных пептидов также аннотированы в базе данных Uniprot.
Но если вы решите пойти дальше в развитии этого, вам сначала нужно будет создать набор данных сигнальных пептидных последовательностей в контексте полных белковых последовательностей. Затем я обучил бы рекуррентную нейронную сеть на этих последовательностях с полной последовательностью белка в качестве входной и сигнальной вероятности пептида в качестве выходной. Это, вероятно, не будет работать из коробки, поэтому вам нужно будет немного поработать.