Я следовал инструкциям из раздела Использование BigQuery с Pandas API Colab , и он отлично работает для меня. Сначала вам нужно создать проект Cloud Platform, если у вас его еще нет, а затем включить биллинг и BigQuery API.
При запуске первого фрагмента кода необходимо щелкнуть ссылку, которая отображается в консоли, скопировать код подтверждения и вставить его в консоль в поле Enter verification code
:
from google.colab import auth
auth.authenticate_user()
Перед запуском второго фрагмента кода вам необходимо изменить имя поля project_id
на имя вашего фактического проекта, который вы создали в GCP:
import pandas as pd
# https://cloud.google.com/resource-manager/docs/creating-managing-projects
project_id = 'your Cloud Platform project ID'
sample_count = 2000
row_count = pd.io.gbq.read_gbq('''
SELECT
COUNT(*) as total
FROM `bigquery-public-data.samples.gsod`
''', project_id=project_id).total[0]
df = pd.io.gbq.read_gbq(f'''
SELECT
*
FROM
`bigquery-public-data.samples.gsod`
WHERE RAND() < {sample_count}/{row_count}
''', project_id=project_id)
print(f'Full dataset has {row_count} rows')
После этого вы получите следующий вывод :
Надеюсь, это поможет вам.