Сравнение строк / символов и побитовое сравнение в Python - PullRequest
0 голосов
/ 07 мая 2011

У меня есть большой набор данных нуклеотидных последовательностей (проще говоря, длинных строк), который преобразуется в матрицу 104 * 13440, полную символов. Мой проект вынуждает меня выполнять вырожденное сопоставление строк, одновременно исследуя все возможные состояния / возможности (т. Е. Никакой необычной эвристики и / или скрининга). Поскольку набор данных настолько велик, ручная проверка всех кортежей слов за символом очень расстраивает и усложняет вычисления.

Будет ли преобразование символов в соответствующий двоичный файл и реализация второстепенных нейронных сетей с использованием побитовых сравнений сэкономить время обработки и потребление памяти по сравнению с простым сравнением символов?

Я использую Python 3.

Забыл упомянуть, кортежи слов перекрываются, размер которых варьируется от 15-25 символов / кортеж, поэтому вы можете увидеть дилемму

1 Ответ

0 голосов
/ 07 мая 2011

Будет ли преобразование символов в соответствующий двоичный файл и реализация второстепенных нейронных сетей с использованием побитовых сравнений сэкономить время обработки и потребление памяти по сравнению с простым сравнением символов?

Нет.Внедрение чего-то более сложного, например нейронной сети, для решения проблемы сравнения строк займет больше времени.

Если вы хотите ускорить свой код, я рекомендую опубликовать его на http://codereview.stackexchange.com,, где будут присутствовать люди.скажу вам, что вы можете сделать, чтобы сделать это быстрее.

...