Для существующих наборов данных: согласно данные github repo , похоже, сохраняются рядом с путем к модулю Scikit:
def load_boston(return_X_y=False):
# ...
module_path = dirname(__file__)
fdescr_name = join(module_path, 'descr', 'boston_house_prices.rst')
with open(fdescr_name) as f:
descr_text = f.read()
data_file_name = join(module_path, 'data', 'boston_house_prices.csv')
, поэтому ищите: <module>\data\filename
Для извлеченных данных:
см. эту страницу документации scikit , цитата:
sklearn.datasets.fetch_20newsgroups(
data_home=None, # this is what you're looking for
subset=’train’,
categories=None,
shuffle=True,
random_state=42,
remove=(),
download_if_missing=True)
data_home: необязательно, по умолчанию: нет
Укажите папку для загрузки и кэширования для наборов данных. Если нет, все данные scikit-learn хранятся в подпапках ~/scikit_learn_data
.