Question

Я работаю над огромным набором данных, мне нужно разделить набор данных по странам, используя куст для хранения и обработки, но данные для одной страны составляют около 70% набора данных, поэтому размер раздела этой страны очень огромный по сравнению с разделом другой страны. Какой самый оптимальный способ обработки этого искаженного набора данных с использованием Hive?

Улей перекошенный раздел данных с огромным размером

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Улей перекошенный раздел данных с огромным размером

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы