Не очень хорошая идея разбирать html с помощью регулярных выражений в целом. Вместо этого используйте html-парсер.
Тем не менее, следующее регулярное выражение даст вам идентификатор из данной строки .
<span[^>]*id="(\d+)"
Первая группа матча, $1
, будет содержать 31313131313
.
Предполагается числовой идентификатор. Для буквенно-цифровых символов замените \d
на [0-9a-zA-Z]
. Вы можете использовать \w
, если _
тоже подойдет.