Программно получить размер строки кэша? - PullRequest
161 голосов
/ 27 апреля 2009

Все платформы приветствуются, пожалуйста, укажите платформу для вашего ответа.

Аналогичный вопрос: Как программно получить размер страницы кэша ЦП в C ++?

Ответы [ 8 ]

162 голосов
/ 28 апреля 2009

В Linux (с относительно новым ядром) вы можете получить эту информацию из / sys:

/sys/devices/system/cpu/cpu0/cache/

В этом каталоге есть подкаталог для каждого уровня кэша. Каждый из этих каталогов содержит следующие файлы:

coherency_line_size
level
number_of_sets
physical_line_partition
shared_cpu_list
shared_cpu_map
size
type
ways_of_associativity

Это дает вам больше информации о кэше, чем вы когда-либо надеялись узнать, включая размер строки кэша (coherency_line_size), а также то, какие процессоры совместно используют этот кэш. Это очень полезно, если вы выполняете многопоточное программирование с общими данными (вы получите лучшие результаты, если потоки, совместно использующие данные, также совместно используют кэш).

123 голосов
/ 09 мая 2010

В Linux посмотрите на sysconf (3).

sysconf (_SC_LEVEL1_DCACHE_LINESIZE)

Вы также можете получить его из командной строки, используя getconf:

$ getconf LEVEL1_DCACHE_LINESIZE
64
112 голосов
/ 29 октября 2010

Я работал над некоторыми строками кеша и мне нужно было написать кроссплатформенную функцию. Я отправил его в репозиторий github на https://github.com/NickStrupat/CacheLineSize,, или вы можете просто использовать приведенный ниже источник. Не стесняйтесь делать все, что вы хотите с ним.

#ifndef GET_CACHE_LINE_SIZE_H_INCLUDED
#define GET_CACHE_LINE_SIZE_H_INCLUDED

// Author: Nick Strupat
// Date: October 29, 2010
// Returns the cache line size (in bytes) of the processor, or 0 on failure

#include <stddef.h>
size_t cache_line_size();

#if defined(__APPLE__)

#include <sys/sysctl.h>
size_t cache_line_size() {
    size_t line_size = 0;
    size_t sizeof_line_size = sizeof(line_size);
    sysctlbyname("hw.cachelinesize", &line_size, &sizeof_line_size, 0, 0);
    return line_size;
}

#elif defined(_WIN32)

#include <stdlib.h>
#include <windows.h>
size_t cache_line_size() {
    size_t line_size = 0;
    DWORD buffer_size = 0;
    DWORD i = 0;
    SYSTEM_LOGICAL_PROCESSOR_INFORMATION * buffer = 0;

    GetLogicalProcessorInformation(0, &buffer_size);
    buffer = (SYSTEM_LOGICAL_PROCESSOR_INFORMATION *)malloc(buffer_size);
    GetLogicalProcessorInformation(&buffer[0], &buffer_size);

    for (i = 0; i != buffer_size / sizeof(SYSTEM_LOGICAL_PROCESSOR_INFORMATION); ++i) {
        if (buffer[i].Relationship == RelationCache && buffer[i].Cache.Level == 1) {
            line_size = buffer[i].Cache.LineSize;
            break;
        }
    }

    free(buffer);
    return line_size;
}

#elif defined(linux)

#include <stdio.h>
size_t cache_line_size() {
    FILE * p = 0;
    p = fopen("/sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size", "r");
    unsigned int i = 0;
    if (p) {
        fscanf(p, "%d", &i);
        fclose(p);
    }
    return i;
}

#else
#error Unrecognized platform
#endif

#endif
30 голосов
/ 27 апреля 2009

На x86 вы можете использовать инструкцию CPUID с функцией 2, чтобы определить различные свойства кэша и TLB. Анализ выходных данных функции 2 несколько сложен, поэтому я отсылаю вас к разделу 3.1.3 идентификации процессора Intel и инструкции CPUID (PDF).

Чтобы получить эти данные из кода C / C ++, вам потребуется использовать встроенную сборку, встроенные функции компилятора или вызвать функцию внешней сборки для выполнения инструкции CPUID.

8 голосов
/ 08 октября 2016

Если вы используете SDL2, вы можете использовать эту функцию:

int SDL_GetCPUCacheLineSize(void);

Возвращает размер строки кэша L1 в байтах.

На моем компьютере x86_64 выполняется фрагмент кода:

printf("CacheLineSize = %d",SDL_GetCPUCacheLineSize());

Производит CacheLineSize = 64

Я знаю, что немного опоздал, но просто добавляю информацию для будущих посетителей. В документации SDL в настоящее время говорится, что возвращаемое число находится в килобайтах, но на самом деле это байты.

6 голосов
/ 14 декабря 2009

На платформе Windows:

от http://blogs.msdn.com/oldnewthing/archive/2009/12/08/9933836.aspx

GetLogicalProcessorInformation функция даст вам характеристики логических процессоров, используемых система. Вы можете ходить SYSTEM_LOGICAL_PROCESSOR_INFORMATION возвращается функцией, ищущей записи типа RelationCache. каждый такая запись содержит ProcessorMask который говорит вам, какой процессор (ы) запись относится к, и в CACHE_DESCRIPTOR, он говорит вам, что тип кэша описывается и насколько велика строка кеша для этого кэш.

4 голосов
/ 13 октября 2015

ARMv6 и выше имеет C0 или регистр типа кэша. Однако он доступен только в привилегированном режиме.

Например, из Техническое руководство Cortex ™ -A8 :

Цель регистра типа кэша - определить инструкцию и минимальная длина строки кэша данных в байтах, чтобы включить диапазон адреса, которые будут признаны недействительными.

Регистр типа кэша:

  • регистр только для чтения
  • доступно только в привилегированных режимах.

Содержимое регистра типа кэша зависит от конкретного реализация. Рисунок 3-2 показывает расположение битов в кэше Тип Регистрация ...


Не думайте, что процессор ARM имеет кеш (очевидно, что некоторые могут быть настроены без него). Стандартный способ определить это через C0. От ARM ARM , стр. B6-6:

Начиная с ARMv6, регистр типа кэша сопроцессора управления системой является Обязательный метод для определения кэшей L1, см. Регистр типа кэша на страница B6-14. Это также рекомендуемый метод для более ранних вариантов архитектура. Кроме того, соображения по дополнительным уровням Кэш на странице B6-12 описывает рекомендации по архитектуре для уровня 2 поддержка кеша.

3 голосов
/ 28 апреля 2009

Вы также можете попытаться сделать это программно, измерив некоторое время. Очевидно, что он не всегда будет таким же точным, как cpuid и т.п., но он более переносим. ATLAS делает это на этапе настройки, вы можете посмотреть на это:

http://math -atlas.sourceforge.net /

...