Отсутствует значение словаря на веб-странице - PullRequest
0 голосов
/ 15 июня 2019

Я делаю скрининг, который получает техническую информацию от Yahoo.Программа создает словарь со всеми техническими данными, которые отображаются на странице статистики.Я немного сбит с толку, потому что у него нет значения «Цена / Книга», несмотря на то, что он соответствует тому же формату HTML, что и другие технические документы, такие как «Возврат на капитал».

Я являюсьнемного сбит с толку, потому что у него нет значения Price / Book, даже если он соответствует тому же формату html, что и другие технические данные, такие как «Return on Equity».

def scrape_yahoo(stock):
    technicals = {}
    try:
        url = ('http://finance.yahoo.com/q/ks?s='+stock)
        page = urllib2.urlopen(url)
        soup = BeautifulSoup(page, 'html.parser')
        tables = soup.findAll('table', {"class" : 'table-qsp-stats'})    # Found using page inspection
        for table in tables:
            table_body = table.find('tbody')
            rows = table_body.find_all('tr')

            for row in rows:
                col_name = row.find_all('span')                            # Use span to avoid supscripts
                col_name = [cell.text.strip() for cell in col_name]
                col_val = row.find_all('td')
                col_val = [cell.text.strip() for cell in col_val]
                technicals[col_name[0]] = col_val[1]                    # col_val[0] is the name cell (with subscript)
        return technicals
    except Exception as e:
        print('Failed, exception: ', str(e))



def scrape(stock_list, interested, technicals):
    SuggestedStocks = []
    for each_stock in stock_list:
        technicals = scrape_yahoo(each_stock)
        condition_1 = float(technicals.get('Return on Equity',0).replace('%','').replace('N/A','-100')) > 25
        condition_2 = float(technicals.get('Trailing P/E',0).replace('N/A','0')) < 25
        condition_3 = float(technicals.get('Price/Book(mrq)',0)) <8
        condition_4 = float(technicals.get('Beta (3Y Monthly)',0)) <1.1
        if condition_1 and condition_2 and condition_3 and condition_4:
            print(each_stock)

            SuggestedStocks.append(each_stock)  
            for ind in interested: 

                print(ind + ": "+ technicals[ind])         
            print("------")
            time.sleep(1)   
                                               # Use delay to avoid getting flagged as bot
    #return technicals
    print(SuggestedStocks)


def main():

    stock_list = ['MMM', 'ABT', 'ABBV', 'ABMD', 'ACN', 'ATVI', 'ADBE', 'AMD', 'AAP', 'AES', 'AMG', 'AFL', 'A', 'APD', 'AKAM', 'ALK', 'ALB', 'ARE', 'ALXN', 'ALGN', 'ALLE', 'AGN', 'ADS', 'LNT', 'ALL', 'GOOGL', 'GOOG', 'MO', 'AMZN', 'AMCR', 'AEE', 'AAL', 'AEP', 'AXP', 'AIG']
    interested = ['Return on Equity', 'Revenue', 'Quarterly Revenue Growth','Trailing P/E', 'Beta (3Y Monthly)']#,'Price/Book(mrq)']
    technicals = {}

    tech = scrape(stock_list, interested, technicals)
    print(tech)

main()

KeyError: 'Price / Book (mrq)', я понимаю, что означает эта ошибка, мой главный вопрос: почему это значение не добавляется в словарь?

1 Ответ

1 голос
/ 15 июня 2019

Название поля на странице - «Цена / книга (мр.)» Вместо «Цена / книга (мр.)», Вы пропустили пробел.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...