Чтобы не увеличивать задержку, параллельные вычислительные программы обычно создают только один поток на ядро. Приложения, которые не являются чисто вычислительными, имеют тенденцию добавлять больше потоков, так что количество работающих потоков - это количество ядер (остальные находятся в состоянии ожидания ввода-вывода и не конкурируют за процессорное время).
Теперь, параллелизм в программах, связанных с дисковым вводом / выводом, может привести к снижению производительности, если диск имеет ничтожно малое время поиска, тогда будет потрачено гораздо больше времени на поиск и меньше времени на чтение. Это называется «взбалтывание» или «избиение». Сортировка лифта в чем-то помогает, правда, произвольный доступ (например, твердотельная память) помогает больше.
Параллелизм почти всегда увеличивает общий объем выполненной необработанной работы, но это важно только в том случае, если срок службы батареи имеет первостепенное значение (и к тому времени, когда вы учитываете энергию, потребляемую другими компонентами, такими как подсветка экрана, выполнение быстрее в целом еще эффективнее).