Regex - удаление дубликатов - как исправить, чтобы включить пробелы в совпадение - PullRequest
0 голосов
/ 18 марта 2020

Я использовал \b(\w+)\|(?=.*\b\1\|?), чтобы удалить любые дубликаты в списке, разделенном |

Я не очень знаком с регулярным выражением, но мне интересно, как я мог бы изменить это, чтобы включить пробелы в совпадении.

Например, в настоящее время, если список BD001 | BD007 | BD006 | BD007 | BD004, формула возвращает BD001 | BD006 | BD007 | BD004, что отлично.

Однако, возможно, быть примерами, когда записи списка могут содержать пробелы и / или тире

Пример пробела EG BD 001 | BD 007 | BD 006 | BD 007 | BD 004
В настоящее время это переводится как BD 001 | BD BD 006 | BD 007 | BD 004 в том смысле, что он удалил дубликат 007, но оставил BD (пробел)

Как изменить, чтобы показать результат BD 001 | BD 006 | BD 007 | BD 004 вместо?

Кроме того, штрихи в порядке, так как это считается символом ascii? Или нужно внести поправку для включения таких записей, как BD-007 et c

Заранее спасибо ...

...