Я очень взволнован недавно выпущенной службой машинного обучения Azure (превью), которая является отличным шагом по сравнению с предыдущим (и устарелым) инструментом машинного обучения.
Однако я много думаюо лучшей практике структурирования папок и файлов в моем проекте (ах).Я попытаюсь объяснить свои мысли.
Глядя на документацию для обучения модели (например, Tutorial # 1 ), кажется, что есть хорошая практика, чтобы поместить все обучающие сценариии необходимые дополнительные сценарии внутри подпапки, чтобы ее можно было передать в объект Estimator
, не передавая при этом все остальные файлы в проекте.Это нормально.
Но при работе с развертыванием службы, в частности развертыванием образа, документация (например, Tutorial # 2 ), кажется, указывает, что сценарий оценки долженнаходиться в корневой папке.Если я пытаюсь сослаться на сценарий, расположенный в подпапке, я получаю сообщение об ошибке, гласящее:
WebserviceException: Unable to use a driver file not in current directory. Please navigate to the location of the driver file and try again.
Это может не иметь большого значения.Кроме того, у меня есть несколько дополнительных сценариев, которые я импортирую как в сценарий обучения, так и в сценарий оценки, и я не хочу дублировать эти дополнительные сценарии, чтобы иметь возможность импортировать их как в сценарии обучения, так и в сценарии оценки.
Я работаю в основном в Jupyter Notebooks при выполнении обучения и развертывания, и я, конечно, мог бы использовать некоторые приемы для чтения конкретных сценариев из другой папки, сохранения их на диск в качестве копии, выполнения обучения или развертывания, покассылаясь на копии и, наконец, удалить копии.Это был бы достойный обходной путь, но мне кажется, что должен быть лучший способ, чем просто приличный.
Как вы думаете?