Когда я смотрю разговоры по программированию о скомпилированных языках, они часто могут рассказать о том, как программа работает на детальном уровне. Например, написание кода одним способом может привести к созданию ассемблерных инструкций, которые более затратны для запуска на ЦП, чем если бы они были написаны другим способом. Пишу в Python У меня нет доступа к этому уровню информации. Итак, не проверяя вывод asm, какие методы я могу использовать, чтобы рассуждать о моей программе, чтобы оптимизировать скорость ее выполнения на процессоре? И могут ли эти методы применяться в целом или они различаются в зависимости от языка программирования и оборудования, на котором он работает?