Ошибка при подключении ADLS к ноутбуку в AML - PullRequest
1 голос
/ 01 апреля 2020

Я получаю ошибку ниже при подключении набора данных, созданного и зарегистрированного в записной книжке AML и основанного на ADLS. Когда я подключаю этот набор данных в конструкторе, я могу визуализировать то же самое. Ниже приведен код, который я использую. Пожалуйста, дайте мне знать решение, если кто-то сталкивался с такой же ошибкой.

Пример 1 Импорт набора данных в notebbok

from azureml.core import Workspace, Dataset

subscription_id = 'abcd'
resource_group = 'RGB'
workspace_name = 'DSG'

workspace = Workspace(subscription_id, resource_group, workspace_name)
dataset = Dataset.get_by_name(workspace, name='abc')
dataset.to_pandas_dataframe()

Ошибка 1

ExecutionError: Could not execute the specified transform.
(Error in getting metadata for path /local/top.txt.
Operation: GETFILESTATUS failed with Unknown Error: The operation has timed out..
Last encountered exception thrown after 5 tries.
[The operation has timed out.,The operation has timed out.,The operation has timed out.,The operation has timed out.,The operation has timed out.]
[ServerRequestId:])|session_id=2d67

Пример 2 Импорт данных из хранилища данных в записную книжку

from azureml.core import Workspace, Datastore, Dataset

datastore_name = 'abc'
workspace = Workspace.from_config()

datastore = Datastore.get(workspace, datastore_name)
datastore_paths = [(datastore, '/local/top.txt')]
df_ds = Dataset.Tabular.from_delimited_files(
    path=datastore_paths, validate=True,
    include_path=False, infer_column_types=True,
    set_column_types=None, separator='\t',
    header=True, partition_format=None
    )

df = df_ds.to_pandas_dataframe()

Ошибка 2

Cannot load any data from the specified path. Make sure the path is accessible.

Ответы [ 2 ]

0 голосов
/ 02 апреля 2020

Для вашего набора данных ab c, можете ли вы визуализировать / просмотреть данные на ml. azure .com? Это может быть связано с тем, что ваши права доступа к данным не настроены правильно в ADLS. Вам необходимо дать разрешение субъекту службы для файла / папки, к которой вы обращаетесь.

https://docs.microsoft.com/en-us/azure/data-lake-store/data-lake-store-access-control

Настройка доступа к данным для файла в ADLS enter image description here

0 голосов
/ 01 апреля 2020

Попробуйте удалить начальный sla sh с вашего пути 'local/top.txt'

datastore_paths = [(datastore, 'local/top.txt')]

...