+ 1 для BeautifulSoup
Теперь, когда у вас есть данные, вам нужно поместить их в MySQL. Если вы хотите чисто Python-решение, вам также понадобится привязка MySQL-Python .
В противном случае SQL, который вам потребуется для генерации, будет относительно безболезненным. Мы будем угонять пример gnuds. Добавить в начало файла:
import re
Тогда внизу:
exp = r'\"(.*)\" <(.*)>'
for row in rows:
matcher = re.match(exp, row[1])
name, email = matcher.groups()
phone = row[3]
sql = "INSERT INTO company (email, name, phone) VALUES ('%s','%s','%s')" % (email, name, phone)
print sql
Что дает вам вывод как:
INSERT INTO company (email, name, phone) VALUES ('email@email.com','JSC company inc. 00','1231231234');
INSERT INTO company (email, name, phone) VALUES ('email01@email.com','JSC company inc. 01','234234234234234');
INSERT INTO company (email, name, phone) VALUES ('email2@email.com','JSC company inc. 02','32423234234');
INSERT INTO company (email, name, phone) VALUES ('email3@email.com','JSC company inc. 03','23423424324');
INSERT INTO company (email, name, phone) VALUES ('email4@email.com','JSC company inc. 04','234234232324244');