зажигалки,
Я использую красивый суп для сбора данных с HTML-страницы, которая имеет несколько столбцов под телом таблицы.
Пожалуйста, под проверяемым кодом:
from bs4 import BeautifulSoup
import requests
import urllib.request as urllib2
import re
import json
app_page = urllib2.urlopen(myUrl)
soup = BeautifulSoup(app_page)
print(soup.prettify())
data = soup.find_all("script")[7]
data=re.sub("\n","",str(data))
print(data)
Вывод:
<script type="text/javascript"> var appsTableData=[[<"<a href='Something'/>"]]</script>
p = re.compile(' var appsTableData=(.*?)')"
print(p)
m = p.match(str(data))
print(m)
Вывод: нет
Я не уверен, почему регулярное выражение не может распознать переменную.