предопределить некоторые аналогичные charcters для регулярных выражений - PullRequest
0 голосов
/ 16 декабря 2018

У меня +1000 слов в черном списке для оскорбительных слов, и я хочу сопоставить их с регулярным выражением для любых возможных символов.например:

  • для слова kir
  • [CcĆćĈĉÇçČčĊċςСс] для c
  • [ĶķΚκКкЌќ] для k
  • [IíiÌìÎîÏïĨĩǏǐĪīĬĭİıĮįΙιȊІіЇї] для * **
  • [RrŔŕŖŗŘřṚȒṛṜṝЯя] для r
  • [OoÓóÒòÔôÖöÕõǑǒŌō0ŎŏǪǫŐőðØøδΘθΟοσΦφΩОоФфЮю] для o
  • [UuÚúÛûŨũǓǔǖǘǚǜŰűυUuÙùÜüŮůŪūŬŭŲųμЦцЧчЏџ]] u * 101 * 10 * 101 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * 10 * * 10*
    1. замена каждого символа на приведенные выше коды приведет к разрыву синтаксиса регулярных выражений

    2. - я знаю, что мы можем предварительно очистить весь текст этими кодами, но я хочучтобы знать, есть ли другая возможность, которая может сделать это с помощью регулярного выражения?

    Язык - PHP, и это регулярное выражение должно быть выполнено в Фильтр злоупотреблений MediaWiki

...