Тест 1 имеет в 10 раз больше запросов, чем одновременных выполнений, что помогает амортизировать стоимость любых холодных запусков. С другой стороны, результаты теста 2 хуже, потому что тест 2 полностью холодный.
Прямо сейчас ваши тесты не обязательно являются честным сравнением (в зависимости от того, что вы пытаетесь измерить). Вы можете попробовать повторить Тест 2 с числом запросов, в 10 раз превышающим параллелизм, чтобы увидеть, получаете ли вы результаты, аналогичные Тесту 1.