Я использую PIG latin для обработки журналов, потому что это выражается в проблеме, когда данные недостаточно велики, чтобы беспокоиться о настройке целого кластера hadoop. Я запускаю PIG в локальном режиме, но думаю, что он не использует все имеющиеся у него ядра (в данный момент 16), мониторинг ЦП показывает максимум 200% загрузки ЦП.
Есть ли уроки или рекомендации по тонкой настройке PIG для локального исполнения? Я уверен, что все картографы могли бы использовать все доступные ядра с некоторой легкой настройкой. (В моем скрипте я уже установил параметр default_parallel равным 20)
С уважением.