огромные страницы, выделенные mmap, медленнее, чем posix_memalign - PullRequest
1 голос
/ 26 апреля 2019
#include <stdlib.h>
#include <stdio.h>
#include <strings.h>
#include <sys/mman.h>
#include <time.h>

#define HUGEPAGE 2048*1024
void *normal_malloc(int len)
{
    void *ptr = malloc(len);
    bzero(ptr, len);
    return ptr;
}

void *trans_malloc(int len)
{
    void *ptr = NULL;
    int ret = posix_memalign(&ptr, HUGEPAGE, len);
    if(ret) perror("posix_memalign");
    ret = madvise(ptr, len, MADV_HUGEPAGE);
    bzero(ptr, len);
    return ptr;
}

void *mmap_malloc(int len)
{
    void *ptr = mmap(NULL, len, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS|MAP_HUGETLB, -1,0);
    return ptr;
}

int main(int argc, char **argv)
{
    char *ptr = NULL;
    int len = HUGEPAGE*256;
    srand(time(NULL));
    switch(argc){
        case 1: ptr = normal_malloc(len);break;
        case 2: ptr = trans_malloc(len);break;
        case 3: ptr = mmap_malloc(len); break;
    }

    long j = 0;
    for(int i=0;i<len;i++){
        j += ptr[rand()%len];
    }
    return 0;
}

Я использую обычные malloc и posix_memalign и mmap для проверки производительности.Мой результат теста: malloc стоит около 29,7 с, posix_memalign стоит около 23,5 с, а mmap очень близко к mallocposix_memalign, и mmap используют огромные страницы.Почему одно имеет очевидное улучшение, а другое нет?Я неправильно использую mmap?Я не делаю bzero для mmap, так как на страницах руководства написано, что «его содержимое инициализируется нулем».

...