Я новичок в ML, pandas и numpy.
Я просматривал файл jupyter программы линейной регрессии. Там я увидел dataset = pd.read_csv('C:\First ML Projects/winequality.csv')
.
Когда я сделал type(dataset)
, я получил pandas.core.frame.DataFrame
. Имеет смысл, потому что набор данных был создан с использованием метода pd
Затем был этот код,
X = dataset[['fixed acidity', 'volatile acidity', 'citric acid', 'residual sugar', 'chlorides', 'free sulfur dioxide', 'total sulfur dioxide', 'density', 'pH', 'sulphates','alcohol']].values
Когда я сделал type(X)
, я получил numpy.ndarray
.
Первый вопрос: почему X
был не в формате pandas.DataFrame
?
Второй: Когда не было упоминания о numpy или np, как он конвертировался numpy.ndarray
?
В-третьих: В чем разница между pandas .DataFrame и numpy .ndarray, поскольку оба хранят данные?