Я возился со строками регулярных выражений и strsplit, но не могу понять, как решить мою проблему.
У меня есть коллекция HTML-документов, которые всегда будут содержать фразу "people own these"
.Я хочу извлечь номер, непосредственно предшествующий этой фразе.то есть «732 234 человека владеют ими» - я надеюсь запечатлеть число 732 234 (включая запятую, хотя мне все равно, будет ли она удалена).Число и фраза всегда заключены в.Я пытался использовать Xpath, но это казалось даже сложнее, чем выражение регулярных выражений.Любая помощь или совет с благодарностью!
пример строки:> 742 811 человек владеют этими <</p>
-> 742 811