Итак, шаблон регулярного выражения, который я придумал, ищет что-то, начиная с CL
, а затем 8 непробельных символов. regex101.com предоставляет удобное объяснение.
import re
string = r"""Detalle
Total
4040CL02
Correccion de BL
CLSAI10608LV-PASSERO V0008-MBL : ISGA0F000
47.020"""
match = re.search(r"[C][L]\S{8}", string)
if match:
code = match.group()
print(code)
Вывод: CLSAI10608
Таким образом, вы захотите заменить string
на pageobj.extractText()
.