[Хех, отвечая на этот вопрос, он был перенесен в суперпользователя, , затем удален, и теперь он, похоже, волшебным образом вернулся сюда. Третья попытка - это очарование!]
Я не очень разбираюсь в SSE, но это механизм для работы с несколькими наборами данных параллельно за такт. (Старые чипы оставляли удивительное количество простоя кремния за цикл; чипы лучше выполняли несколько инструкций за цикл самостоятельно, но это требовало изрядного количества догадок и полностью проваливалось в некоторых алгоритмах с большим объемом данных.) Поэтому SSE требует страница из старых систем SIMD , которая позволяла выполнять одни и те же команды для нескольких частей данных. Время установки могло бы занять больше времени, но в долгосрочной перспективе лот было выполнено.
В зависимости от того, что вы пытаетесь сделать, это может иметь огромное значение , но большинству программистов, вероятно, никогда не понадобятся инструменты, которые может предоставить SSE.
Что касается выполнения 32-битных процессов в 64-битных процессах для экономии памяти, это реальная возможность. Но когда AMD впервые представила набор инструкций x86-64, они очень осторожно указывали на новые инструкции и дополнительные регистры, которые могли бы повысить производительность при выполнении задач, для которых не хватало адресного пространства или выполнялись многие 64-битные арифметические операции. Они отметили, что большинство людей, вероятно, хотели бы, чтобы большая часть кода выполнялась в 64-битном режиме, но увеличение производительности в большинстве случаев было бы незначительным.
Таким образом, за исключением Firefox и Flash, 64-битная версия является повсеместной, и расширение памяти за счет более крупных указателей не кажется большой проблемой.