Я запускаю код из первой главы Практического машинного обучения Орелиена Жерона с помощью Scikit-Learn и TensorFlow.
Код, который я пытаюсь запустить:
# Code example
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import sklearn.linear_model
# Load the data
oecd_bli = pd.read_csv(datapath + "oecd_bli_2015.csv", thousands=',')
gdp_per_capita = pd.read_csv(datapath + "gdp_per_capita.csv",thousands=',',delimiter='\t',
encoding='latin1', na_values="n/a")
# Prepare the data
country_stats = prepare_country_stats(oecd_bli, gdp_per_capita)
X = np.c_[country_stats["GDP per capita"]]
y = np.c_[country_stats["Life satisfaction"]]
# Visualize the data
country_stats.plot(kind='scatter', x="GDP per capita", y='Life satisfaction')
plt.show()
# Select a linear model
model = sklearn.linear_model.LinearRegression()
# Train the model
model.fit(X, y)
Он не работает на шаге model.fit(X, y)
со следующей трассировкой:
ValueError Traceback (most recent call last)
in
23
24 # # Train the model
---> 25 model.fit(X, y)
26
27 # # Make a prediction for Cyprus
~\AppData\Local\Programs\Python\venv\ds\lib\site-packages\sklearn\linear_model\_base.py in fit(self, X, y, sample_weight)
531 else:
532 self.coef_, self._residues, self.rank_, self.singular_ = \
--> 533 linalg.lstsq(X, y)
534 self.coef_ = self.coef_.T
535
~\AppData\Local\Programs\Python\venv\ds\lib\site-packages\scipy\linalg\basic.py in lstsq(a, b, cond, overwrite_a, overwrite_b, check_finite, lapack_driver)
1223 raise LinAlgError("SVD did not converge in Linear Least Squares")
1224 if info < 0:
-> 1225 raise ValueError('illegal value in %d-th argument of internal %s'
1226 % (-info, lapack_driver))
1227 resids = np.asarray([], dtype=x.dtype)
ValueError: illegal value in 4-th argument of internal None
Однако, когда я повторно запускаю функцию подгонки без команды plt.show()
, она работает нормально:
country_stats.plot(kind='scatter', x="GDP per capita", y='Life satisfaction')
model.fit(X, y) # works OK
# # Make a prediction for Cyprus
X_new = [[22587]] # Cyprus' GDP per capita
print(model.predict(X_new)) # outputs [[ 5.96242338]]
Очень странное поведение. Не уверен, что это связано с моими версиями пакетов. Вот мои текущие версии пакета:
pip freeze | grep -E "numpy|pandas|scipy|matplotlib|sci"
matplotlib==3.2.1
numpy==1.18.4
pandas==0.25.3
scikit-image==0.16.2
scikit-learn==0.22
scipy==1.4.1