У меня есть строка с именем test_text
, содержащая слова контрольного примера:
wk wkw wkk kwk kkw wkwk kwkw wkkw kwkk kwkwk wkwkwk wkwoowkwko www k kkk wkwkland
Используя регулярное выражение , я хочу сопоставить все слова, которые считаются индонезийским смехом:
wk wkw wkk kwk kkw wkwk kwkw wkkw kwkk kwkwk wkwkwk
и исключить (не ограничиваясь ими)
wkwoowkwko www k kkk wkwkland
Для этой области я предполагаю, что смехотворным словом является любое слово, которое содержит только буквы w
и k
хотя бы по одному для каждого.
Я пробовал:
import re
re.findall("(k*w+k+w*k*)+\s", test_text)
re.findall("k?(?:w{0,2}k{0,2}w{1,2})+k\s?", test_text)
re.findall("w*[Ww]\w*k+\s", test_text)
Но, похоже, ничто не соответствует всем тестам.