У меня проблема с разделением информационного кадра. Я довольно новичок в ноутбуке Jupyter и python, так что это может быть ошибкой ладьи ie. Мой код предназначен для копирования таблицы с веб-сайта и ее повторения в блокноте Jupyter. Мой код до сих пор:
html = urlopen(url)
soup = BeautifulSoup(html, 'lxml')
rows = soup.find_all('table')
import re
list_rows = []
for row in rows:
cells = row.find_all('td')
str_cells = str(cells)
clean = re.compile('<.*?>')
clean2 = (re.sub(clean, '',str_cells))
list_rows.append(clean2)
df = pd.DataFrame(list_rows)
df.drop([1,2])
df1 = df[0].str.split(',', expand=True)
df1[0] = df1[0].str.strip('[')
df1.drop(2, axis=1)
df1.dropna()
Вывод:
У него есть текст, а затем 5 следующих значений, за которыми следует повторение пробела. Как я могу разбить кадр данных на пустые места и вставить их друг под другом, чтобы он выглядел следующим образом?