Kaggle BigQuery интеграция - PullRequest
0 голосов
/ 16 марта 2020

Kaggle предоставляет ссылку на Big Query, есть ли API, выполняющий c, и примеры для ссылки. Вот что я устал

# Set your own project id here
PROJECT_ID = 'your-google-cloud-project'
from google.cloud import bigquery
bigquery_client = bigquery.Client(project=PROJECT_ID)
from google.cloud import storage
storage_client = storage.Client(project=PROJECT_ID)

hn_dataset_ref = bigquery_client.dataset('DC Taxi Trips', project='bigquery-public-data')
hn_dset = bigquery_client.get_dataset(hn_dataset_ref)
[x.table_id for x in bigquery_client.list_tables(hn_dset)]

Я получил сообщение об ошибке: 1004 *

/ opt / conda / lib / python3 .6 / site-packages / google / cloud / _http .py в api_request (self, method, path, query_params, data, content_type, заголовки, api_base_url, api_version, ожидаем_ json, _target_object, timeout) 421 422, если не 200 <= response.status_code <300: -> 423 повышение exceptions.from_http_response (response) 424 425, если ожидаете_ json и response.content:

BadRequest: 400 GET https://www.googleapis.com/bigquery/v2/projects/bigquery-public-data/datasets/DC%20Taxi%20Trips: недопустимый идентификатор набора данных "D C Поездки на такси". Идентификаторы набора данных должны быть буквенно-цифровыми (плюс подчеркивания и тире) и должны содержать не более 1024 символов.

Набор данных, к которому я пытался получить доступ, https://www.kaggle.com/bvc5283/dc-taxi-trips/metadata

1 Ответ

1 голос
/ 16 марта 2020

Ошибка говорит это:

Идентификаторы набора данных должны быть alphanumeri c (плюс подчеркивания и тире) и должны быть не более 1024 символов.

Так , если вы не уверены в своем идентификаторе набора данных, то, возможно, попробуйте параметры, разделенные alphanumeri c underscore / da sh (например, dc-taxi-trips или dc_taxi_trips).

...