Использует ли sklearn индекс панд как функцию? - PullRequest
1 голос
/ 31 октября 2019

Я передаю в пандас DataFrame, содержащий различные функции, sklearn, и я не хочу, чтобы оценщик использовал индекс dataframe в качестве одной из функций. Использует ли sklearn индекс в качестве одной из функций?

df_features = pd.DataFrame(columns=["feat1", "feat2", "target"])
# Populate the dataframe (not shown here)
y = df_features["target"]
X = df_features.drop(columns=["target"])

estimator = RandomForestClassifier()
estimator.fit(X, y)

1 Ответ

3 голосов
/ 31 октября 2019

Нет, sklearn не использует индекс как одну из ваших функций. По сути, это здесь , когда вы вызываете метод fit, будет применена функция check_array. И теперь, если вы углубитесь в check_array функцию , вы обнаружите, что вы конвертируете свои входные данные в массив, используя функцию np.array, которая, по существу, удаляет индексы из вашего кадра данных, как показано ниже:

import pandas as pd 
import numpy as np
data = [['tom', 10], ['nick', 15], ['juli', 14]] 
df = pd.DataFrame(data, columns = ['Name', 'Age']) 
df  

    Name    Age
0   tom     10
1   nick    15
2   juli    14

np.array(df)
array([['tom', 10],
       ['nick', 15],
       ['juli', 14]], dtype=object)

Надеюсь, это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...