Как я могу разархивировать CSV-файлы, загруженные из Kaggle на Google Colab? - PullRequest
0 голосов
/ 24 января 2019

Я хочу разархивировать CSV-файлы, загруженные из kaggle на Google Colab, с помощью кода нижеНо каждый раз, когда я запускаю команду unzip, он говорит, что такой файл или каталог не найден, в то время как colab сообщает, что файлы были успешно загружены!

!pip install kaggle
from googleapiclient.discovery import build
import io, os
from googleapiclient.http import MediaIoBaseDownload
from google.colab import auth
auth.authenticate_user()
drive_service = build('drive', 'v3')
results = drive_service.files().list(
    q="name = 'kaggle.json'", fields="files(id)").execute()
kaggle_api_key = results.get('files', [])
# print(kaggle_api_key)
filename = "/content/.kaggle/kaggle.json"
os.makedirs(os.path.dirname(filename), exist_ok=True)
request = drive_service.files().get_media(fileId=kaggle_api_key[0]['id'])
fh = io.FileIO(filename, 'wb')
downloader = MediaIoBaseDownload(fh, request)
done = False
while done is False:
    status, done = downloader.next_chunk()
    print("Download %d%%." % int(status.progress() * 100))
os.chmod(filename, 600)


!kaggle competitions download -c pubg-finish-placement-prediction
!chmod 600 /root/.kaggle/kaggle.json

!unzip train_V2.zip

Вывод: unzip: не удается найти или открыть train_V2.zip,train_V2.zip.zip или train_V2.zip.ZIP.

Даже распаковка train_V2.csv.zip не работает!Что я делаю не так?

1 Ответ

0 голосов
/ 31 января 2019

В Google Colab они могут стереть все ваши данные, если вы повторно подключаетесь или меняете тип среды выполнения . Так что будьте осторожны с вашими данными.

Перед запуском файла вы должны проверить, существует ли файл. Попробуйте вывести список файлов, используя команду ls. Если файл не существует, попробуйте разместить его снова. Если вы загружаете его из Интернета, вы можете использовать команду wget.

...