Я хочу эффективно отсортировать большой набор данных (то есть с пользовательским разделителем, как описано здесь: Как работает алгоритм сортировки MapReduce? ), но я хочу сделать это с кустом.
Тем не менее, руководство Hive утверждает, что "упорядочение по" выполняется одним редуктором.
Это удивляет меня, поскольку свинья реализует нечто похожее на статью - pig impl
Я что-то упустил, или улей просто не подходит для этой работы?