Как прочитать все файлы, содержащиеся в подпапке для внешних таблиц в Sql Server Data Warehouse - PullRequest
1 голос
/ 18 апреля 2019

Мне нужно загрузить данные из datalake в хранилище данных сервера sql с использованием таблиц polybase. Я создал настройку для создания внешних таблиц. Я создал внешнюю таблицу с расположением в виде "/ A / B / PARQUET/*.паркет/".Но я получаю ошибку неверного пути. В папке PARQUET есть подпапки с именем .parquet, в этой папке есть файлы .parquet. Поскольку нет пути с именем * .parquet.но как получить все подпапки (.паркет) в папке PARQUET?Есть ли способ получить все подпапки, содержащие файлы .parquet, в папке PARQUET. Может кто-нибудь помочь мне в этом?Заранее спасибо.

CREATE EXTERNAL TABLE [dbo].[EXT_TEST1]
( A VARCHAR(10),B VARCHAR(20)) 
(DATA_SOURCE = [Azure_Datalake],LOCATION = N'/A/B/PARQUET/*.parquet/',FILE_FORMAT =csvfileformat,REJECT_TYPE = VALUE,REJECT_VALUE = 1)

folder structure:
A->B->PARQUET->asdfolder.parquet-> file1.parquet
             ->dfgfolder.parquet-> file2.parquet
             ->shdfolder.parquet-> file3.parquet

1 Ответ

1 голос
/ 18 апреля 2019

Пожалуйста, измените местоположение на:

LOCATION = '/A/B/PARQUET'

Polybase загрузит все файлы в этой папке и подпапках. Единственным исключением являются файлы или папки, которые начинаются с точки (.) или подчеркивания (_), как описано здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...