В анатомии высокопроизводительного умножения матриц они определяют термин R_load
как «скорость, с которой числа с плавающей запятой могут передаваться из кэша L2 в регистры».Есть ли способ, которым я могу вычислить этот термин для данного процессора?