Когда вы анализируете URL в интернете, вам нужно сначала найти способ загрузки html-содержимого страницы. Есть отличные библиотеки, такие как запросы, которые, как говорят, лучше всего подходят для python. Скажем, вы хотите разобрать https://stackoverflow.com/
import requests
response = requests.get("https://stackoverflow.com/")
page_html = response.text
page_html - это html-страница в строке python, тогда вы можете рассматривать его как локальный html-файл и анализировать их любым способом.
Что касается получения всех вхождений паттерна, вы можете сделать soup.findAll('input',name='fooId',type='hidden')
вместо soup.find()
. Soup.findAll вернет список всех вхождений.