Python для открытия HTML-файлов в Excel - PullRequest
0 голосов
/ 05 июня 2018

У меня есть куча заказов на покупку в форматах .html, которые мне нужны для извлечения данных и размещения в одном простом листе Excel.Хотя я мог бы использовать beutifulsoup для этого, я бы предпочел использовать встроенный конвертер Excel, который уже работает намного лучше.Тогда просто работайте с файлами Excel напрямую.Есть ли способ использовать Python для открытия HTML-документов, а затем сохранить его снова в .xlsx.Я пытался использовать openpyxl, но он не принимает HTML-файлы.

Ответы [ 2 ]

0 голосов
/ 20 марта 2019

Вы можете использовать tablepyxl , чтобы прочитать html в excel, если нужные вам данные находятся в таблицах html.

0 голосов
/ 06 июня 2018

Вы можете использовать Python для автоматизации экземпляра приложения Excel, открытия каждого файла и сохранения как .xlsx:

import win32com.client
excelApp = win32com.client.Dispatch('Excel.Application')
book = excelApp.Open(path_to_html_file)
book.SaveAs(path_to_html_file + '.xlsx', 51)
...