Я учусь на Профессионального инженера данных, и мне интересно, что такое «рекомендуемая Google передовая практика» для горячих данных в Datapro c (учитывая, что затраты не имеют значения)?
Если стоимость В связи с этим я обнаружил рекомендацию хранить все данные в облачном хранилище, потому что это дешевле.
Можно ли настроить механизм, чтобы все данные находились в облачном хранилище, а последние данные автоматически кэшировались в HDFS? Нечто подобное AWS делает с FSx / Luster и S3.