Question

Согласно gcc docs , memcmp не является встроенной функцией GCC. Если вы хотите ускорить работу memcmp glibc в gcc, вам нужно использовать встроенные функции более низкого уровня, определенные в документации. Однако при поиске в Интернете у многих людей складывается впечатление, что memcmp является встроенной функцией. Это для некоторых компиляторов, а не для других?

Justin L. · Answer 1 · 13 июня 2011

Обратите внимание, что процедура repz cmpsb может выполняться не быстрее чем memcmp glibc. В моих тестах, на самом деле, это никогда быстрее, даже при сравнении всего нескольких байтов.

См. http://gcc.gnu.org/bugzilla/show_bug.cgi?id=43052

Lance Richardson · Answer 2 · 13 мая 2009

Ваша ссылка, по-видимому, предназначена для встроенных функций, специфичных для архитектуры x86, согласно этот memcmp реализован как независимый от архитектуры встроенный в gcc.

Редактировать:

Компиляция следующего кода с Cygwin GCC версии 3.3.1 для i686, -O2:

#include <stdlib.h>

struct foo {
    int a;
    int b;
} ;

int func(struct foo *x, struct foo *y)
{
    return memcmp(x, y, sizeof (struct foo));
}

Создает следующий вывод (обратите внимание, что вызов memcmp () преобразуется в 8-байтовый "repz cmpsb"):

   0:   55                      push   %ebp
   1:   b9 08 00 00 00          mov    $0x8,%ecx
   6:   89 e5                   mov    %esp,%ebp
   8:   fc                      cld    
   9:   83 ec 08                sub    $0x8,%esp
   c:   89 34 24                mov    %esi,(%esp)
   f:   8b 75 08                mov    0x8(%ebp),%esi
  12:   89 7c 24 04             mov    %edi,0x4(%esp)
  16:   8b 7d 0c                mov    0xc(%ebp),%edi
  19:   f3 a6                   repz cmpsb %es:(%edi),%ds:(%esi)
  1b:   0f 92 c0                setb   %al
  1e:   8b 34 24                mov    (%esp),%esi
  21:   8b 7c 24 04             mov    0x4(%esp),%edi
  25:   0f 97 c2                seta   %dl
  28:   89 ec                   mov    %ebp,%esp
  2a:   5d                      pop    %ebp
  2b:   28 c2                   sub    %al,%dl
  2d:   0f be c2                movsbl %dl,%eax
  30:   c3                      ret    
  31:   90                      nop

Nick · Answer 3 · 11 мая 2017

Теперь в 2017 году GCC и Clang, похоже, имеют некоторые оптимизации для буферов размеров 1, 2, 4, 8 и некоторых других, например, 3, 5 и кратные 8.

встроенный memcmp

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

встроенный memcmp

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы