Почему не печатается ни одна строка, а расчетные коэффициенты NaN? - PullRequest
1 голос
/ 29 марта 2019

Код импортирует набор данных в код, используя numpy.genfromtxt, а затем пытается построить линию регрессии через график рассеяния.Однако график рассеяния печатает, а линия - нет.Также расчетные коэффициенты выдачи NaN.В чем проблема?

import numpy as np 
import matplotlib.pyplot as plt 
from numpy import genfromtxt

def estimate_coef(x, y): 
    # number of observations/points 
    n = np.size(x) 

    # mean of x and y vector 
    m_x, m_y = np.mean(x), np.mean(y) 

    # calculating cross-deviation and deviation about x 
    SS_xy = np.sum(y*x) - n*m_y*m_x 
    SS_xx = np.sum(x*x) - n*m_x*m_x 

    # calculating regression coefficients 
    b_1 = SS_xy / SS_xx 
    b_0 = m_y - b_1*m_x 

    return(b_0, b_1) 

def plot_regression_line(x, y, b): 
    # plotting the actual points as scatter plot 
    plt.scatter(x, y, color = "m", 
               marker = "o", s = 30) 

    # predicted response vector 
    y_pred = b[0] + b[1]*x 

    # plotting the regression line 
    plt.plot(x, y_pred, color = "g") 

    # putting labels 
    plt.xlabel('x') 
    plt.ylabel('y') 

    # function to show plot 
    plt.show() 

def main(): 
    # observations 
    x = genfromtxt('/Users/divyanshuvarma/Downloads/graduate-admissions/Admission_Predict.csv', delimiter=',',usecols=(1))
    y = genfromtxt('/Users/divyanshuvarma/Downloads/graduate-admissions/Admission_Predict.csv', delimiter=',',usecols=(8))


    # estimating coefficients 
    b = estimate_coef(x, y) 
    print("Estimated coefficients:\nb_0 = {}  \
          \nb_1 = {}".format(b[0], b[1])) 

    # plotting regression line 
    plot_regression_line(x, y, b) 

if __name__ == "__main__": 
    main() 

Ответы [ 2 ]

0 голосов
/ 29 марта 2019

Проблема заключалась в файле CSV. Numpy.genfromtxt также считывал первую строку файла csv, в которой были имена (метки) значений, которые следовали в последующих строках. Поэтому я использовал skip_header = 1, чтобы остановить чтение строковых значений.

0 голосов
/ 29 марта 2019

В функции estimate_coef есть деление b_1 = SS_xy / SS_xx.Вы распечатали значение SS_xx, может быть, оно равно нулю?Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...