Проблемы с запросом общедоступных данных BigQuery на локальной рабочей станции - PullRequest
0 голосов
/ 01 марта 2019

Я пытаюсь запросить общедоступные данные из API BigQuery (набора данных Ethereum) на моем colab.

Я пробовал это

from google.colab import auth
auth.authenticate_user()
from google.cloud import bigquery
eth_project_id = 'crypto_ethereum_classic'
client = bigquery.Client(project=eth_project_id)

и получаю это сообщение об ошибке:

WARNING:google.auth._default:No project ID could be determined. Consider running `gcloud config set project` or setting the GOOGLE_CLOUD_PROJECT environment variable

Я также пытался использовать библиотеку BigQueryHelper и получаю похожее сообщение об ошибке

from bq_helper import BigQueryHelper
eth_dataset = BigQueryHelper(active_project="bigquery-public-data",dataset_name="crypto_ethereum_classic") 

Ошибка:

WARNING:google.auth._default:No project ID could be determined. Consider running `gcloud config set project` or setting the GOOGLE_CLOUD_PROJECT environment variable
---------------------------------------------------------------------------
OSError                                   Traceback (most recent call last)
<ipython-input-21-53ac8b2901e1> in <module>()
      1 from bq_helper import BigQueryHelper
----> 2 eth_dataset = BigQueryHelper(active_project="bigquery-public-data",dataset_name="crypto_ethereum_classic")

/content/src/bq-helper/bq_helper.py in __init__(self, active_project, dataset_name, max_wait_seconds)
     23         self.dataset_name = dataset_name
     24         self.max_wait_seconds = max_wait_seconds
---> 25         self.client = bigquery.Client()
     26         self.__dataset_ref = self.client.dataset(self.dataset_name, project=self.project_name)
     27         self.dataset = None

/usr/local/lib/python3.6/dist-packages/google/cloud/bigquery/client.py in __init__(self, project, credentials, _http, location, default_query_job_config)
    140     ):
    141         super(Client, self).__init__(
--> 142             project=project, credentials=credentials, _http=_http
    143         )
    144         self._connection = Connection(self)

/usr/local/lib/python3.6/dist-packages/google/cloud/client.py in __init__(self, project, credentials, _http)
    221 
    222     def __init__(self, project=None, credentials=None, _http=None):
--> 223         _ClientProjectMixin.__init__(self, project=project)
    224         Client.__init__(self, credentials=credentials, _http=_http)

/usr/local/lib/python3.6/dist-packages/google/cloud/client.py in __init__(self, project)
    176         if project is None:
    177             raise EnvironmentError(
--> 178                 "Project was not passed and could not be "
    179                 "determined from the environment."
    180             )

OSError: Project was not passed and could not be determined from the environment.

Просто повторяю, я использую Colab - я знаю, как запрашивать данные в Kaggle, но мне нужно делать это на моем colab

1 Ответ

0 голосов
/ 14 мая 2019

IN Colab - сначала необходимо пройти аутентификацию.

from google.colab import auth
auth.authenticate_user()

Это будет аутентифицировать вашу учетную запись пользователя в проекте.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...