Попытка регулярного выражения строки, содержащей несколько чисел в качестве различных базовых счетчиков - PullRequest
0 голосов
/ 07 августа 2020

В настоящее время создается модуль шифрования в python 3.8, и вы столкнулись с проблемой с желаемой функцией / обновлением. Ищу некоторую помощь в поиске решения, которое было бы более полезным, чем написание «искателя строк» ​​для анализа зашифрованной строки данных.

В моем первом «официальном» выпуске все работает нормально, но это связано с насколько проще разбить строку на основе легко идентифицируемых префиксов в строке. Например, «0x» в шестнадцатеричной системе счисления или «0o» в восьмеричной системе.

Текущие определения того, что может населять число, используют вышеупомянутые базовые типы вместе с поддержкой счетчиков от 2 до 10 в виде '{n } bXX '.

То, что я реализовал в настоящее время, отлично работает для настоящего дизайна, но возникают проблемы с попыткой придумать что-то, что может обрабатывать более высокие базы (по крайней мере, до 64), что не работает быть громоздким или медленным; Кроме того, при редизайне возникают проблемы с синтаксическим анализом строки, содержащей несколько базовых счетчиков, после присвоения их соответствующих символов.

TL; DR - Если у меня есть такая закодированная строка: "0x9a0o25179b83629b86740xc01d64b9HM-70o5521" Я хотел бы, чтобы он был разделен на: [0x9a, 0o2517, 9b8362, 9b8674, 0xc0ld, 64b9HM-7, 0o5521] и вам нужна помощь в поиске лучшего решения, чем: r '(?: 0x) | (?: 9b) | ...'

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...