Самый простой способ сделать это, скорее всего, разделить текст точкой с запятой, чтобы получить все до этого. Затем вы можете разделить это снова и оставить только цифры c части.
from bs4 import BeautifulSoup
tag = "<span class = 'ocrx_word' id = 'word_1_45' title = 'bbox 369 429 301 123;x_wconf 96'>refrence</span>"
soup = BeautifulSoup(tag, 'html.parser')
s = soup.findAll('span')
for span in s:
print([x for x in span.attrs['title'].split(';')[0].split() if x.isdigit()])