Javascript regex: удалить все атрибуты, кроме href, из нескольких тегов привязки. Не может включать двойные кавычки в регулярное выражение - PullRequest
0 голосов
/ 06 августа 2020

Итак, мне нужно вырезать все атрибуты из нескольких тегов привязки, за исключением href = "some value". Механизм шаблонов, который я использую, позволяет запускать серверные функции перед рендерингом окончательного результата, но по какой-то внутренней причине я не могу включить двойные кавычки в регулярное выражение, иначе функция просто не сработает. Итак, с учетом сказанного, давайте скажем, что у меня есть следующее HTML:

<p>just a bunch of text here<a data-sv-linklookup-id="https://www.somesite.com/somevalue/?i=632738&amp;ver=html5" data-sv-linklookup-type="plugins_nav_external_link" href="https://www.somesite.com/somevalue/?i=632738&amp;ver=html5" target="_blank">view it online</a> or request it through our<a data-sv-linklookup-id="5a8dad3e2f124e053ecfe720" data-sv-linklookup-type="plugins_nav_navitem_primary_main" href="https://www.somesite.com/plan-your-trip/free-visitor-guide/" target="_self" title="some title">online form</a>. a lot more text here<a data-sv-linklookup-id="5a8dad402f124e053ecfebd2" data-sv-linklookup-type="plugins_nav_navitem_primary_main" href="https://www.somesite.com/" target="_self" title="some title">some more text</a></p>

Пока я пробовал следующее:

/data-sv-linklookup-id=.[^\s]*|data-sv-linklookup-type=.[^\s]*|target=.[^>]*|title=.[^>]*/g

Что приводит к:

<p>just a bunch of text here<a   href="https://www.somesite.com/somevalue/?i=632738&amp;ver=html5" >view it online</a> or request it through our<a   href="https://www.somesite.com/plan-your-trip/free-visitor-guide/" >online form</a>. a lot more text here<a   href="https://www.somesite.com/" >some more text</a></p>

Это отлично работает для моих целей, но есть вероятность, что они могут быть добавлены другими атрибутами, и я просто не могу добавить все возможности к условному выражению. Спасибо за любой ввод

1 Ответ

2 голосов
/ 06 августа 2020

Edit: не включает двойные кавычки, вместо них используется код ascii.

https://regex101.com/r/KNMcZh/5

Затем для замены do:

yourString.replace(/<a.*?(href=\x22.*?\x22).*?>/g, '<a $1>');

Обратите внимание, что это будет работать только для якорей, содержащих href. Ко всем атрибутам из якорей, не содержащих href do:

yourString.replace(/<a .*?>/g, '<a>');
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...