Как написать регулярное выражение для соответствия указанному c слову в строке, когда в строку добавлены пробелы в случайных местах?
У меня есть строка, извлеченная из PDF-документ, имеющий табличную структуру. Как следствие этой структуры извлеченная строка содержит случайно вставленные новые строки и пробелы. Специфические c слова и фразы, которые я ищу, содержат символы в правильном порядке, но случайным образом разделены пробелами. Например: «sta ck over flow».
Содержимое документа pdf было извлечено с помощью PyPDF2, поскольку это единственный вариант, доступный в библиотеке python моей компании.
Я знаю, что Я могу написать для этого конкретное c строковое совпадение с возможным пробелом после каждого символа, но должен быть лучший способ его поиска.
Вот пример того, что я пытался делать.
my_string = "find the ans weron sta ck over flow"
# r's\s*t\s*a\s*c\s*k\s*' # etc
my_cleaned_string = re.sub(r's\s*t\s*a\s*c\s*k\s*', '', my_string)
Есть предложения?