Как извлечь ключ из ненужной Html Wrapping в python - PullRequest
0 голосов
/ 31 августа 2009

HTML-страница, содержащая ключ и несколько символов \ n. Мне нужно использовать только ключевой блок, т. Е. От ----- НАЧАЛО PGP PUBLIC KEY BLOCK ----- до ----- END PGP PUBLIC KEY BLOCK ----- и после помещения извлекающего ключа в файл я могу передать его в любой функции ....

1 Ответ

0 голосов
/ 31 августа 2009

в простейшем виде

import re
clean = re.sub("</?[^\W].{0,10}?>|\n|\r\n", "", your_html) #remove tags and newlines
key = re.search(r'BEGIN PGP PUBLIC KEY BLOCK.+?END PGP PUBLIC KEY BLOCK', clean)

или если вам не нужны BEGIN PGP ... BLOCK и END PGP ... BLOCK:

key = re.search(r'BEGIN PGP PUBLIC KEY BLOCK----(.+?)----END PGP PUBLIC KEY BLOCK',clean)

это то, что вы ищете? (У меня нет Python прямо здесь, чтобы проверить его, но я надеюсь, что все в порядке)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...