Насколько я понимаю, алфавит, который вы используете, содержит только четыре значения A, C, G, T (последовательности ДНК, я полагаю).
Достаточно простого сравнения:
seq = 'TGGAGGCCCACAACCATTCCCTCAGCCCAATTGACCGAAAGGGCGCGA';
msg_int = zeros(size(seq));
msg_int(seq=='A') = 1;
msg_int(seq=='C') = 2;
msg_int(seq=='G') = 3;
msg_int(seq=='T') = 4;