Возможно, вы захотите использовать dask.bag вместо dask.dataframe
import json
import dask.bag as db
mybag = db.read_text('gs://xxxxxx/2018-04-18/data-*.json').map(json.loads)
После этого вы можете преобразовать сумку в фрейм данных dask с помощью
mybag.to_dataframe()
Для этого могут потребоваться некоторыедополнительные возможности использования dask.map для правильного построения структуры.
Если ваши данные имеют тип joop hadoop (он же один объект на строку), трюк с мешками все равно будет работать, но вам, возможно, придется работать с отдельными строками.