Я хочу завершить работу над «Большой таблицей» и «Большим запросом» для моего сценария использования временных рядов.
Я прошел https://cloud.google.com/bigtable/docs/schema-design-time-series
Это для хранения данных Omniture, которые содержат информациюнапример, ключ посетителя веб-сайта (некоторый длинный ключ), его идентификатор куки-файла (некоторый длинный ключ), веб-хиты данных временных меток для его IP-адреса, cookie
Что можно использовать в качестве ключа строки для большой таблицы?Я не могу использовать метку времени или CookieId в качестве префикса, как я узнал из лучших практик.Но должен иметь идентификатор (предпочтительно алфавит?), А затем суффикс временной серии.Объем данных составляет 500 миллионов, и сегодня в таблице SQL хранятся 52 столбца.Я думаю, что данные могут быть обновлены на основе обработки OLTP.Но позже к таблице будут обращаться данные временных рядов для такой же обработки OLAP.
a) Будет ли большая таблица здесь лучшим вариантом, или я должен использовать большой запрос, так как простой запрос на основе данных временных рядов поможетмне больше?б) При использовании большой таблицы, какой будет лучшим ключ строки, так как временные ряды являются единственным значимым фильтром, который я вижу для моих данных.Я полагаю, что при использовании других полей в таблице, таких как ключ посетителя, идентификаторы cookieid (длинные идентификаторы) в качестве префикса с меткой времени, все равно будет вызывать заполнение всего узла на 1 узел в Bigtable вместо распределения.
Пожалуйста, дайте мне знать,