Загрузить fetch_lfw_people с помощью прокси - PullRequest
0 голосов
/ 22 ноября 2018

Я хочу использовать этот набор данных для обучения.Но когда я пытаюсь загрузить его с помощью встроенного загрузчика sklearn, я получаю ошибку.

from sklearn import datasets 
lfw_people = datasets.fetch_lfw_people(min_faces_per_person=50, 
                resize=0.4, data_home='.', )

Ошибка:

Ошибка urlopen [WinError 10061]

Я знаю, что речь идет о прокси - обычно для установки новых пакетов я использую опцию --proxy.Но как это сделать сейчас?Такой опции нет в datasets.fetch_lfw_people


Я думал о том, чтобы вручную загрузить ее с официального сайта: http://vis -www.cs.umass.edu / lfw / # download Но я не знаю, какой выбрать и как открыть после этого в python.

1 Ответ

0 голосов
/ 23 ноября 2018

fetch_lfw_people по умолчанию проверит данные в '~/scikit_learn_data/lfw_home', чтобы увидеть, загружен ли набор данных и исправлен ли он (путем сопоставления хэшей).

Согласно исходный код , он загружает 4 файла со следующих URL:

Таким образом, вы можете загрузить эти файлы и сохранить их в указанной папке.После этого просто вызовите метод fetch_lfw_people, и он загрузит данные из этого местоположения без подключения к Интернету.

Здесь ~ относится к домашнему местоположению пользователя.Вы можете использовать следующий код, чтобы узнать расположение этой папки по умолчанию в соответствии с вашей системой.

from sklearn.datasets import get_data_home
print(get_data_home())

Поскольку вы изменили это значение на data_home='.', вам следует использовать ~/lfw_home без 'scikit_learn_data' (т.е. сделать lfw_home прямо в домашней папке).

...