Очиститель lxml с пользовательским тегом? - PullRequest
0 голосов
/ 14 октября 2010

Я хочу использовать lxml cleaner, чтобы избавиться от всего html, но затем регулярное выражение для автоматической привязки чего-либо:

[ABC] -> <a href="bah bah bah">ABC</a>

как правильно справиться с этим без xss и тому подобного?

1 Ответ

1 голос
/ 14 октября 2010

Может быть, подойдет уценка с отключенным встроенным HTML?Модуль python markdown вполне готов.

Ознакомьтесь с разделом "безопасный режим" в документах для получения дополнительной информации о выделении встроенного HTML.

В зависимости от того, что вы хотите, может подойти что-то вроде py-wikimarkup .

Использование пользовательского регулярного выражения, вероятно, не очень хорошая идея, потому что

  • вам придется объяснить правила людям, которые, возможно, уже знакомы с уценкой / WikiText
  • вам придется предоставить способ избежать текста, например, для людей, которые действительно хотят писать [ABC]
  • вам придется исправлять любые ошибки, включая проблемы безопасности
...