Оказывается, ваша реализация SQLite REGEXP
основана на PCRE.
Вы можете настроить \b
Unicode, используя глагол (*UCP)
PCRE:
'(*UCP)\bтекст\b'
Некоторые подробности о глаголе в pcrepattern man page :
Другая специальная последовательность, которая может появиться в начале шаблона, - (*UCP)
.Это имеет тот же эффект, что и установка параметра PCRE_UCP
: это приводит к тому, что последовательности, такие как \d
и \w
, используют свойства Unicode для определения типов символов вместо распознавания только символов с кодами меньше 128 через таблицу поиска.
И позже:
Обратите также внимание, что PCRE_UCP
влияет на \b
и \B
, поскольку они определены в терминах \w
и \W
.Совпадение этих последовательностей заметно медленнее, если установлено PCRE_UCP
.
Что ж, это будет медленнее, поскольку теперь ему приходится иметь дело со всей таблицей Юникода.