Заранее благодарю за любую помощь. У меня есть текущий CSV исторических данных, связанных с URL CFTC: https://www.cftc.gov/dea/options/other_lof.htm
Я хочу создать скрипт для извлечения данных с этого сайта раз в неделю и автоматического обновления моих CSV исторических данных. В настоящее время я застрял при попытке импортировать только данные "Random Length Lumber" в новый CSV. HTML-код выглядит так:
<code> <pre> <!--ih:includeHTML file="other_lof.txt"-->PALLADIUM - NEW YORK MERCANTILE EXCHANGE... # It then continues listing ALL data from all of the commodities
<!--/ih:includeHTML-->
и продолжает перечислять все данные по всем товарам.
Мой код Python начинается так:
from bs4 import BeautifulSoup
import urllib.request
page = urllib.request.urlopen(url)
soup = BeautifulSoup(page, 'lxml')
# table = soup.find('')
Здесь я хотел бы получить доступ только к данным Lumber и экспортировать их в Excel, однако пока я не могу выбрать нужные данные, я не хочу записывать все данные в Excel. Любая помощь или руководство будет принята с благодарностью. Спасибо.