Я пытаюсь написать регулярное выражение для удаления всего HTML-кода, за исключением ссылок (теги <a href
и </a>
соответственно. Это не обязательно должно быть на 100% безопасно (меня не волнуют инъекционные атаки или что-нибудь, поскольку я анализирую контент, который уже был одобрен и опубликован в фильме SWF ).
Исходное регулярное выражение "strip tags", которое я использовал, было <(.|\n)+?>
, и я попытался изменить его на <([^a]|\n)+?>
, но это, конечно, позволит использовать любой тег с a в а не тот, который имеет его в начале, с пробелом.
Не то чтобы это действительно имело значение, но на случай, если кто-то захочет узнать, я пишу это в ActionScript 3.0 для Flash фильма.