Доступ к архивированным экземплярам BigQuery общедоступных наборов данных переполнения стека - PullRequest
0 голосов
/ 13 ноября 2018

Я пытаюсь проанализировать количество ПРОСМОТРОВ для вопросов переполнения стека с течением времени. Мне просто нужно несколько снимков (например, ежеквартально) за последние 1-2 года, чтобы продемонстрировать, как со временем меняется спрос на «ответы» в различных технологиях.

enter image description here

Кто-нибудь знает, можно ли получить доступ к историческим версиям общедоступного набора данных в BigQuery? Google должен отслеживать эти базы данных по мере их изменения и развития.

BigQuery содержит актуальный набор данных StackOverflow. Хотя это позволяет анализировать, когда вопросы задаются и на которые даются ответы, это не говорит о том, как количество просмотров меняется со временем. Я также исследовал использование бейджей и даты их присуждения в качестве средства оценки изменений в счетчиках, но это слишком грубо.

В интернет-архиве есть один дамп данных из Stack Exchange (март 2018 г.), но, опять же, этого недостаточно!

1 Ответ

0 голосов
/ 13 ноября 2018

Вам повезло, у меня есть идеальный ответ на этот вопрос: Да.

Проверьте: https://towardsdatascience.com/these-are-the-real-stack-overflow-trends-use-the-pageviews-c439903cd1a

Чтобы запросить мои архивы, вы можете сделать что-то вроде:

#standardSQL
WITH historic_views AS (
  SELECT *, '201703' q
  FROM `fh-bigquery.stackoverflow_archive.201703_posts_questions` 
  UNION ALL
  SELECT *, '201706' q 
  FROM `fh-bigquery.stackoverflow_archive.201706_posts_questions` 
  UNION ALL
  SELECT *,  '201709' q 
  FROM `fh-bigquery.stackoverflow_archive.201709_posts_questions` 
  UNION ALL
  SELECT *, '201712' q 
  FROM `fh-bigquery.stackoverflow_archive.201712_posts_questions` 
  UNION ALL
  SELECT *, '201803' q 
  FROM `fh-bigquery.stackoverflow_archive.201803_posts_questions` 
  UNION ALL
  SELECT *, '201806' q 
  FROM `fh-bigquery.stackoverflow_archive.201806_posts_questions` 
)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...