Я пытаюсь извлечь слова, содержащие хотя бы один символ, из специального набора символов. Он поднимает некоторые слова, а не другие. Вот ссылка на regex101 для его проверки. Это регулярное выражение \b(\w*[āīūẓḍḥṣṭĀĪŪẒḌḤṢṬʿʾ]+\w*)\b
, и это примерное предложение, которое я использую
Его полное имя Абу ʿĪса Мухаммад ибн ʿĪса ибн Савра ибн Муса ибн
Аль-Данак Аль-Сулами Аль-Тирмидхи.
Оно должно соответствовать следующим словам:
Иса Мухаммад Иса Муса Аль-Дахак Аль-Сулами Аль-Тирмидхи
Я не слишком разбираюсь в регулярных выражениях, поэтому понятия не имею, что я делаю неправильно. Если кто-то знает какой-либо инструмент, чтобы выяснить, почему конкретное слово не соответствует шаблону регулярных выражений, пожалуйста, дайте мне знать.