Я новичок в python и pandas и создал тестовую веб-страницу с html-кодом, который поможет научиться извлекать данные, а затем форматировать в CSV для использования в excel. Ниже приведен код, который я придумал, который помещает его в хороший формат, но я застрял на том, как отформатировать его в файл CSV для импорта.
Код:
# Importing pandas
import pandas as pd
# The webpage URL whose table we want to extract
url = "/home/dvm01/e007"
# Assign the table data to a Pandas dataframe
table = pd.read_html(url,**index_col=0**)[0]
#table2 = pd.read_html(url)[0],pd.read_html(url)[1],pd.read_html(url)[6]
# Print the dataframe
print(table)
#print(table2)
# Store the dataframe in Excel file
#table.to_excel("data.xlsx")
Вывод:
Account Account.1
ID: e007
Description: ABST: 198, SUR: J DOUTHIT
Geo ID: 014.0198.0000
Я пытаюсь понять, как удалить индекс для строк и сделать текст перед первым: стать заголовком столбца. В строке 1 у меня два: но все после первого: должны быть данные для заголовка столбца.
Я хотел бы взять вышеуказанный текущий вывод и иметь в качестве столбца ID, Description и Geo IDЗаголовки и текст, который следует после «:», будут данными для каждого из заголовков.
Мне не нужны «Учетная запись» и «Учетная запись.1». Я считаю, что они распознаются как заголовки столбцов. Ниже я хотел бы, чтобы выходные данные выглядели в Excel, но я не могу понять, как правильно отформатировать их для экспорта в CSV, который можно импортировать. Может быть, мне даже не нужно импортировать или форматировать в CSV, функция 'table.to_excel', похоже, не нуждается в этом шаге.
+------+---------------------------+---------------+
| ID | Description | Geo ID |
+------+---------------------------+---------------+
| e007 | ABST: 198, SUR: J Douthit | 014.0198.0000 |
+------+---------------------------+---------------+
Мне удалось удалить номера индексов, используя index_col =0 выше, где я определяю переменную dfs. Не уверен, что это лучший способ, но он делает то, что я пытался сделать для этой части.
Поскольку я новичок в python, мне трудно форматировать свой вопрос в Google или StackOverflow, чтобы получить ответыЯ ищу. Если бы кто-то мог просто указать мне правильное направление в том, что я ищу, это сработало бы, но примеры были бы также хороши.
Спасибо за любое руководство