Я хотел бы загрузить огромное количество данных, сжатых (.gz), и я не знаю, как справиться с этим.
Мой набор данных это просмотров страниц из Википедии.
Моя цель - предоставить основные статистические показатели для их анализа.
Я нашел эту статью , где используется тот же набор данных, но я не знаю, как загрузить набор данных с помощью скрипта Python, который показан на шаге 1.
Я предполагаю, что при таком большом наборе анализов на локальном компьютере это не правильный подход, отсюда и идея использовать облако Google