Причина, по которой потоки 10+ не обязательно быстрее, чем 3, заключается в том, что с каждым потоком связаны накладные расходы.Это управление самими потоками - обеспечение того, чтобы каждый получал соответствующее время обработки, и управление данными, передаваемыми между потоками.
Следовательно, чем больше у вас потоков, тем больше это не накладные расходы обработки.
Еслиу вас есть четырехъядерный процессор, тогда каждый из трех потоков может работать на ядре 100% времени каждый (это не будет правдой, но это пример).Однако с 9 потоками каждый поток может работать только на 33% времени на ядре - он должен делиться им с 2 другими.Затраты на управление этим означают, что 9 потоков на самом деле медленнее, чем 3.