У вас есть большая проблема - как ваша программа узнает, что:
be
cause
... следует рассматривать как одно слово?
Если вы действительно хотите, вы можете заменитьсимволы новой строки с пустыми пробелами:
import re
document_text = """
i need your help be
cause i am not a good programmer
""".lower().replace("\n", '')
print([w for w in re.findall(r'\b[a-zA-Z0-9_]{1,15}\b', document_text)])
Это будет корректно проверять because
, но не удастся в таких случаях, как:
Hello! My name is
Foo.
... потому что isFoo
не слово.