Как прочитать все файлы OneDrive и скопировать их с помощью Python - PullRequest
0 голосов
/ 14 июля 2020

Я пытаюсь синхронизировать c весь свой OneDrive с AWS S3. Для этого я хочу прочитать все файлы и папки в OneDrive (чтобы я мог записать их в AWS S3). Как мне получить список всех файлов и файлов в папках для OneDrive? Я планирую прочитать все файлы в виде фрейма данных, а затем записать его в AWS S3.

Код, который я использую сейчас, читает файл из OneDrive, который явно упоминается в моем коде. Код взят из этого ответа

import sys, os, time, requests
import pandas as pd
import urllib.parse

OneDrive_FilePath = 'New Folder/Knox EARNSTSALV2020.xlsx'

OneDrive_FileURL = 'https://graph.microsoft.com/v1.0/me/drive/root:/' + OneDrive_FilePath + ':/content'
OneDrive_FileURL = urllib.parse.quote(OneDrive_FileURL, safe=':/')
print(OneDrive_FileURL)

Client_Id = 'XXXX'
Tenant_Id = 'YYYYY'
Refresh_Token_First = 'ZZZZZ'

PostStr = {'grant_type': 'refresh_token', 'client_id': Client_Id, 'refresh_token': Refresh_Token_First}

Token_Response = requests.post('https://login.microsoftonline.com/' + Tenant_Id + '/oauth2/v2.0/token', data=PostStr)

Access_Token = Token_Response.json()['access_token']
New_Refresh_Token = Token_Response.json()['refresh_token']

if Access_Token is None or New_Refresh_Token is None:
    print('\n> Failed: Access_Token NOT Retrieved')
    sys.exit()

Response = requests.get(OneDrive_FileURL, headers={'Authorization': 'Bearer ' + Access_Token})

if Response.status_code == 200:
    print('\n> Response Success')

    with open('Excel File.xlsx', 'wb') as File:
    File.write(Response.content)
    print('\n> File Downloaded')
else:
    print('\n> Failed:', Response.status_code)
    print(Response.content)
python-3.x azure python-requests 

Я хотел бы прочитать все содержимое, а не только упомянутый файл.

Как я могу это сделать?

1 Ответ

1 голос
/ 15 июля 2020

Согласно документации , вы можете перечислить файлы в папке, а затем загрузить:

response = requests.get('/drives/{drive-id}/root:/New Folder/children', headers={'Authorization': 'Bearer ' + Access_Token})

content = json.loads(response.content)
for file in content.values:
    file_response = requests.get(f'/drives/{drive-id}/root:/New Folder/{file.name}/content', headers={'Authorization': 'Bearer ' + Access_Token})
    with open(file.name, 'wb') as dest_file:
        dest_file.write(file_response.content)
...