Ошибка ключа: «Ни один из --- в столбцах» - PullRequest
0 голосов
/ 27 января 2020

Я написал скрипт для очистки данных акций Yahoo Finance с помощью пакета Yahoo_Fin

Цель этого скрипта - получить финансовые данные компании, чтобы иметь возможность выполнять некоторые вычисления. Входные данные для сценария представляют собой текстовый файл со списком символов тикера компании. Предполагается, что вывод также будет txt только с компаниями, которые соответствуют определенному количеству установленных критериев.

Скрипт иногда работает с небольшим txt файлом (20 тикеров или меньше), но иногда дает мне следующая ошибка (без изменения кода)

"Ни один из ['Разбивка'] в столбцах", где Разбивкой является индексный столбец, который я установил для df.

Я выполнил сценарий десятки раз, а иногда и работает, иногда нет. Запустил его в Atom и Jupyter Notebook и до сих пор не понимаю, в чем причина проблемы. Я также обновил pandas и все необходимые пакеты.

Это код:

import pandas as pd
import statistics as stat
from yahoo_fin.stock_info import *

stock_list = [line.rstrip('\n') for line in open("test.txt", "r")]
#print(stock_list)

## The balance sheet df ##
balance_sheet = {ticker: get_balance_sheet(ticker)
                    for ticker in stock_list}

## The income statement df ##
income_statement = {ticker: get_income_statement(ticker)
                    for ticker in stock_list}


bs_data=[]

for i in range(0,len(stock_list)):
    one_ticker = pd.DataFrame(balance_sheet[stock_list[i]])
    one_ticker = one_ticker.set_index('Breakdown')
    bs_data.append(one_ticker)

#print(bs_data)

income_data=[]

#one_ticker =[]

for i in range(0,len(stock_list)):
    one_ticker = pd.DataFrame(income_statement[stock_list[i]])
    one_ticker = one_ticker.set_index('Breakdown')
    income_data.append(one_ticker)

#print(income_data)

    ## These are the balance sheet variables ##

for loop_counter in range(0,len(stock_list)):
    # Total Assets
    total_assets = (bs_data[loop_counter].loc['Total Assets'].astype(int))
    avg_total_assets = stat.mean(total_assets)
    #print(avg_total_assets)

    # Total Current Liabilities
    total_current_liabilities = (bs_data[loop_counter].loc['Total Current Liabilities'].astype(int))
    avg_total_current_liabilities = stat.mean(total_current_liabilities)
    #print(avg_total_current_liabilities)

    #Total Liabilities
    total_liabilities = (bs_data[loop_counter].loc['Total Liabilities'].astype(int))
    avg_total_liabilities = stat.mean(total_liabilities)
    #print(avg_total_liabilities)

    ## These are the income statement variables ##

    # Total Revenue
    total_revenue = (income_data[loop_counter].loc['Total Revenue']).astype(int)
    avg_total_revenue = stat.mean(total_revenue)
    #print(avg_total_revenue)

    # Operating Income
    operating_income = (income_data[loop_counter].loc['Operating Income or Loss']).astype(int)
    avg_operating_income = stat.mean(operating_income)
    #print(avg_operating_income)

    # Total Operating Expenses
    total_operating_expenses = (income_data[loop_counter].loc['Total Operating Expenses'].astype(int))
    avg_total_operating_expenses = stat.mean(total_operating_expenses)
    #print(avg_total_operating_expenses)

    # EBIT
    ebit = (avg_total_revenue-avg_total_operating_expenses)
    #print(ebit)


    ## Calculations ##

    opm = (avg_operating_income) / (avg_total_revenue)
    #print(opm)
    roce = (ebit) / ((avg_total_assets) - (avg_total_current_liabilities))
    #print(roce)
    leverage = (avg_total_liabilities) / (avg_total_assets)
    #print(leverage)

    #print("Leverage: " + str(round(leverage,2)))
    #print("OPM: " + str(round(opm*100,2)) + "%")
    #print("ROCE: " + str(round(roce*100,2)) + "%")

    ## Save to file ##

    #print(leverage)
    #print(opm)
    #print(roce)
    if leverage < 1.00 and roce >= 0.2 and opm >= 0.2:
        #print("We have a match!")
        outfile = open("results.txt", "a")
        outfile.write(stock_list[loop_counter])
        outfile.write("\n")
        outfile.close()

Любые подсказки, в чем может быть проблема ??

Обновление # 2 Код:

import pandas as pd
import statistics as stat
from yahooquery import *

# Ticker input here
stock_list = [line.rstrip('\n') for line in open("test.txt", "r")]

#for stock in stock_list:
tickers = Ticker(stock_list)

# Get balance sheet
for stock in stock_list:
    #print(stock)
    bs = tickers.balance_sheet()
    bs = pd.DataFrame(bs)
    bs = bs.set_index('endDate')
    #print(bs)


## Balance sheet variables to extract ##

# Total Assets
    total_assets = bs['totalAssets']
    avg_total_assets = stat.mean(total_assets)

# Total Current Liabilities
    total_current_liabilities = bs['totalCurrentLiabilities']
    avg_total_current_liabilities = stat.mean(total_current_liabilities)

# Total Liabilities
    total_liabilities = bs['totalLiab']
    avg_total_liabilities = stat.mean(total_liabilities)

## Get income statement ##
    inst = tickers.income_statement()
    inst = pd.DataFrame(inst)
    inst = inst.set_index('endDate')

## Income statement variables to extract ##

# Total Revenue#
    total_revenue = inst['totalRevenue']
    avg_total_revenue = stat.mean(total_revenue)

# Operating Income
    operating_income = inst['operatingIncome']
    avg_operating_income = stat.mean(operating_income)

# Total Operating Expenses
    total_operating_expenses = inst['totalOperatingExpenses']
    avg_total_operating_expenses = stat.mean(total_operating_expenses)

# EBIT
    ebit = (avg_total_revenue-avg_total_operating_expenses)

## Parameters ##
    opm = (avg_operating_income) / (avg_total_revenue)
    roce = (ebit) / ((avg_total_assets) - (avg_total_current_liabilities))
    leverage = (avg_total_liabilities) / (avg_total_assets)

## Save to file ##
    #print("Hello!")
    if leverage < 1.00 and roce >= 0.2 and opm >= 0.2:
        #print("Hello")
        outfile = open("yahoo_query_results.txt", "w+")
        outfile.write(stock)
        outfile.write("\n")
        outfile.close()

1 Ответ

0 голосов
/ 29 января 2020

Я не могу помочь вам с пакетом yahoo_fin, но есть еще один пакет с именем yahooquery , который извлекает данные через API, а не очищает их, и может быть несколько более надежным. Вот как легко получить некоторые данные, которые вы ищете:

from yahooquery import Ticker
tickers = Ticker(['jpm', 'gs', 'c'])

# Get Balance Sheet
df = tickers.balance_sheet() # Annual
df = tickers.balance_sheet(frequency='q') # Quarterly

РЕДАКТИРОВАТЬ:

tickers = Ticker(stock_list)
df = tickers.balance_sheet()
for stock in stock_list:
    stock_df = df.loc[stock]
    # Now do your calcs
...