Загрузка набора результатов в хранилище Azure в виде файла Text / CSV - PullRequest
0 голосов
/ 11 июня 2018

Как мы можем экспортировать набор результатов определенного запроса на выборку в файл (CSV / TEXT) в хранилище Azure ??Есть ли возможность для реализации с использованием SQL или есть уже реализованный механизм обслуживания для того же, например, план обслуживания?Мне нужно что-то вроде кода, должен быть в состоянии создать файл с набором результатов определенного запроса select, который должен быть загружен в указанное место хранения Azure.

Я ищу следующий сценарий. Я хочу удалить некоторые данные из перегруженной таблицы и экспортировать эти данные в файл CSV или TXT, который необходимо выгрузить в хранилище Azure BLOB-объектов, в котором эта задача должна выполняться через регулярные интервалы .Я должен иметь возможность настроить несколько баз данных в одном экземпляре, а также несколько таблиц.

1 Ответ

0 голосов
/ 11 июня 2018

Вы можете использовать фабрику данных Azure и Копировать активность , чтобы экспортировать результат запроса в виде файла CSV, расположенного в хранилище Azure.

Операция копирования может выглядеть следующим образом:

{  
    "name":"SamplePipeline",
    "properties":{  
    "start":"2014-06-01T18:00:00",
    "end":"2014-06-01T19:00:00",
    "description":"pipeline for copy activity",
    "activities":[  
      {
        "name": "AzureSQLtoBlob",
        "description": "copy activity",
        "type": "Copy",
        "inputs": [
          {
            "name": "AzureSQLInput"
          }
        ],
        "outputs": [
          {
            "name": "AzureBlobOutput"
          }
        ],
        "typeProperties": {
          "source": {
            "type": "SqlSource",
            "SqlReaderQuery": "$$Text.Format('select * from MyTable where timestampcolumn >= \\'{0:yyyy-MM-dd HH:mm}\\' AND timestampcolumn < \\'{1:yyyy-MM-dd HH:mm}\\'', WindowStart, WindowEnd)"
          },
          "sink": {
            "type": "BlobSink"
          }
        },
       "scheduler": {
          "frequency": "Hour",
          "interval": 1
        },
        "policy": {
          "concurrency": 1,
          "executionPriorityOrder": "OldestFirst",
          "retry": 0,
          "timeout": "01:00:00"
        }
      }
     ]
   }
}

Более подробную информацию вы найдете здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...