URL-адрес для сырого GitHub CSV постоянно меняется, когда я пытаюсь загрузить в Google Colab - PullRequest
0 голосов
/ 28 мая 2019

Я пытаюсь загрузить большой файл .csv, из которого он хранится в моем github, в записную книжку в google colab. Вот схема кода, который я использую:


#download fixed data sets
import pandas as pd
import numpy as np
url_train = 'https://raw.githubusercontent.com/username/data/master/train_fixed.csv?token=[long_string]'
x_train = pd.read_csv(url_train)

Обычно это будет весело. Однако, часто (но не всегда), если я закрываю блокнот и открываю день спустя, если я просто повторно запускаю код, я получаю ошибку 404 not found для URL, и мне приходится возвращаться к github и переписывать (теперь измененный) необработанный URL для моего файла.

Я не уверен, почему это происходит или в чем я был уверен, и я хотел спросить, сталкивался ли кто-либо еще с этой проблемой и какие решения вы бы порекомендовали. Возможно, проблема в том, что этот репозиторий является частным?

1 Ответ

0 голосов
/ 28 мая 2019

Если репозиторий является закрытым, вполне вероятно, что срок действия аргумента token истекает, поэтому случайное раскрытие URL-адреса не препятствует доступу к данным без возможности отзыва.Я рекомендую организовать динамическое построение URL-адреса после извлечения параметра token в контексте текущего сеанса.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...