Я использую регулярное выражение в python и пытаюсь извлечь символ «хинди» из заданной строки, а затем распечатать его, но я не могу этого сделать. Я пытаюсь извлечь 12 и 22 из строки. Код должен искать фразу, которая начинается с जनवरी (или любого символа хинди) и заканчивается 12 (или любым числом). Вот код:
import re
string = "विश्व कप sdsd 12वें संस्करण जनवरी12 or 12जनवरी or जनवरी22"
mo = re.compile(r'[^(^a-zA-Z-0-9)]+\d+')
print(mo.findall(string))
Вывод: ['12', 'वें संस्करण जनवरी 12', '12', 'जनवरी 22']
Я знаю, что [^ abc] соответствует любому символ, который не заключен в квадратные скобки и пытался добиться того же с помощью [^ (^ a-zA-Z-0-9)] +, но результат не тот, который я ожидал.
Ожидаемый результат: जनवरी 12 , जनवरी 22 * 1008 *
Может кто-нибудь объяснить мне, как это должно быть сделано и сопоставить начало и конец в регулярном выражении Python?