Я хочу удалить индикатор типа Fig 1.
в строке caption
, где caption
может быть:
# each line is one instance of caption
"Figure 1: Path of Reading Materials from the Web to a Student."
"FIGURE 1 - Travel CP-net"
"Figure 1 Interpretation as abduction, the big picture."
"Fig. 1. The feature vector components"
"Fig 1: IMAGACT Log-in Page"
"FIG 1 ; The effect of descriptive and interpretive information, and Inclination o f Fit"
...
Я пробовал caption = re.sub(r'figure 1: |fig. 1 |figure 1 -', '', caption, flags=re.IGNORECASE)
, но это выглядит беспорядочно: я действительно нужно перечислить все возможности вручную? Есть ли какой-нибудь код элемента, который бы соответствовал всем им?
Большое спасибо!