Где загрузить CSV, чтобы затем прочитать его при кодировании на Jupyter - PullRequest
0 голосов
/ 04 июля 2019

Мне нужно загрузить несколько CSV-файлов где-нибудь в Интернете, чтобы иметь возможность использовать их в Jupyter позже, используя read_csv.Какие бы простые способы сделать это?

CSV содержит базу данных.Я хочу загрузить его куда-нибудь и использовать в Jupyter, используя read_csv, чтобы другие люди могли запускать код, когда я отправляю им свой файл.

Ответы [ 2 ]

1 голос
/ 04 июля 2019

Вы можете использовать любого поставщика облачного хранилища, например Dropbox или Google Drive.В качестве альтернативы вы можете использовать Github.

Чтобы сделать это в своей записной книжке, импортируйте pandas и read_csv, как это обычно делается для локального файла.

import pandas as pd

url="https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"
c=pd.read_csv(url)
0 голосов
/ 04 июля 2019

CSV содержит базу данных.

Поскольку CSV содержит базу данных, я бы не советовал загружать ее на Github, как упомянуто Steven K в предыдущем ответе . Было бы лучше загрузить его на Google Drive или Dropbox, как правильно сказано в предыдущем ответе .

Чтобы прочитать файл с Google Диска, вы можете попробовать следующее:

  • Загрузите файл на Google Drive и нажмите «Получить общую ссылку» и убедитесь, что любой, имеющий ссылку, может получить к ней доступ.
  • Нажмите на ссылку копирования и получите идентификатор файла, связанный с CSV. Пример: если это URL https://drive.google.com/file/d/108ARMaD-pUJRmT9wbXfavr2wM0Op78mX/view?usp=sharing, тогда 108ARMaD-pUJRmT9wbXfavr2wM0Op78mX - это идентификатор файла.

Просто используйте идентификатор файла в следующем примере кода

import pandas as pd

gdrive_file_id = '108ARMaD-pUJRmT9wbXfavr2wM0Op78mX'
data = pd.read_csv(f'https://docs.google.com/uc?id={gdrive_file_id}&export=download', encoding='ISO-8859-1')

Здесь вы открываете CSV любому, кто имеет доступ к ссылке. Лучшим и более контролируемым подходом было бы делиться доступом с известными людьми и использовать библиотеку, такую ​​как PyDrive , которая является оболочкой для официального клиента Python Google API.

ПРИМЕЧАНИЕ: Поскольку в вашем вопросе не упоминается версия Python, которую вы используете, я предположил Python 3.6+ и использовал f-строк в строке № 3 код. Если вы используете любую версию Python до 3.6, вам придется использовать метод форматирования , чтобы подставить значение переменной в строку

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...