Изображение таблицы
Я пытался извлечь таблицу с веб-сайта, только если таблица содержит определенную подстроку.
Я использую запросы для открытия URL-адреса и pandas.html для извлечения таблиц.Однако, делая это, я либо извлекаю все таблицы или определенную таблицу по индексу, и я хочу найти способ извлечь только таблицу с моим ключевым словом.
import requests
import pandas as pd
#url is the website, html opens the site and df_list is extracting all tables
url = 'https://www.sec.gov/Archives/edgar/data/880432/000114420415073214/v427721_def14a.htm'
html = requests.get(url).content
df_list = pd.read_html(html)
Отсюда я могу напечатать df_list[index]
но я хочу таблицу с моим ключевым словом.Я пробовал следующее: (ничего не возвращает)
for i in range(len(df_list)):
if 'Fees Earned' in df_list:
print (df_list[i])
for i in range(len(df_list)):
if any("Fees Earned" in s for s in df_list):
print(df_list[i])
Если я попытаюсь:
print(any(sub in mystring for mystring in mylist))
Я получу только вывод "False"