Замена ld на золото - есть опыт? - PullRequest
75 голосов
/ 13 августа 2010

Кто-нибудь пытался использовать gold вместо ld?

gold обещает намного быстрее, чем ld, так чтоможет помочь ускорить циклы тестирования для больших приложений C ++, но может ли он использоваться в качестве замены для ld?

Может ли gcc / g++ напрямую вызывать gold.?

Есть какие-либо известные ошибки или проблемы?

Хотя gold является частью GNU binutils с тех пор, я почти не нашел в Интернете "историй успеха" или даже "Howtos".

( Обновление: добавлены ссылки на золото и запись в блоге, объясняющая это )

Ответы [ 8 ]

47 голосов
/ 13 августа 2010

В данный момент он собирает большие проекты на Ubuntu 10.04.Здесь вы можете легко установить и интегрировать его с пакетом binutils-gold (если вы удалите этот пакет, вы получите старый ld).Тогда Gcc будет автоматически использовать золото.

Некоторые события:

  • золото не ищет в /usr/local/lib
  • золото не предполагает либов, таких как pthread или rt, пришлось добавить их вручную
  • это быстрее и требует меньше памяти (последнее важно для больших проектов C ++ с большим ускорением и т. д.)

Что не работает: Он не может скомпилировать ядро ​​и, следовательно, нет модулей ядра.Ubuntu делает это автоматически через DKMS, если обновляет проприетарные драйверы, такие как fglrx.Это не работает с ld-gold (необходимо удалить золото, перезапустить DKMS, переустановить ld-gold.

38 голосов
/ 21 декабря 2011

Поскольку мне потребовалось немного времени, чтобы выяснить, как выборочно использовать золото (т.е. не для всей системы, используя символическую ссылку), я выложу решение здесь. Он основан на http://code.google.com/p/chromium/wiki/LinuxFasterBuilds#Linking_using_gold.

  1. Создайте каталог, в который вы можете поместить скрипт с золотым клеем. Я использую ~/bin/gold/.
  2. Поместите следующий скрипт для клея и назовите его ~/bin/gold/ld:

    #!/bin/bash
    gold "$@"
    

    Очевидно, сделать его исполняемым, chmod a+x ~/bin/gold/ld.

  3. Измените ваши вызовы на gcc на gcc -B$HOME/bin/gold, что заставляет gcc выглядеть в данном каталоге для вспомогательных программ, таких как ld, и, таким образом, использует скрипт glue вместо system-default ld.

12 голосов
/ 14 декабря 2016

Может ли gcc / g ++ напрямую вызывать gold?Хотя, AFAIK, можно настроить gcc во время сборки таким образом, чтобы эта опция не имела никакого эффекта.

9 голосов
/ 12 июня 2015

Как разработчик Samba, я использую компоновщик gold почти исключительно в Ubuntu, Debian и Fedora уже несколько лет.Моя оценка:

  • золото во много раз (чувствуется: в 5-10 раз) быстрее, чем классический линкер.
  • Первоначально было несколько проблем, но с тех пор примерноUbuntu 12.04.
  • Золотой компоновщик даже обнаружил некоторые проблемы с зависимостями в нашем коде, поскольку он кажется более правильным, чем классический, с точки зрения некоторых деталей.См., Например, этот коммит Samba .

Я не использовал золото выборочно, но использовал символические ссылки или альтернативный механизм, если его предоставляет дистрибутив.

8 голосов
/ 13 августа 2010

Вы можете связать ld с gold (в локальном двоичном каталоге, если у вас установлено ld, чтобы избежать перезаписи):

ln -s `which gold` ~/bin/ld

или

ln -s `which gold` /usr/local/bin/ld
3 голосов

Минимальный синтетический тест

Результат: золото было примерно в 2–3 раза быстрее для всех значений, которые я пробовал.

generate-objects

#!/usr/bin/env bash
set -eu

# CLI args.

# Each of those files contains n_ints_per_file ints.
n_int_file_is="${1:-10}"
n_ints_per_file="${2:-10}"

# Each function adds all ints from all files.
# This leads to n_int_file_is x n_ints_per_file x n_funcs relocations.
n_funcs="${3:-10}"

# Do a debug build, since it is for debug builds that link time matters the most,
# as the user will be recompiling often.
cflags='-ggdb3 -O0 -std=c99 -Wall -Wextra -pedantic'

# Cleanup previous generated files objects.
./clean

# Generate i_*.c, ints.h and int_sum.h
rm -f ints.h
echo 'return' > int_sum.h
int_file_i=0
while [ "$int_file_i" -lt "$n_int_file_is" ]; do
  int_i=0
  int_file="${int_file_i}.c"
  rm -f "$int_file"
  while [ "$int_i" -lt "$n_ints_per_file" ]; do
    echo "${int_file_i} ${int_i}"
    int_sym="i_${int_file_i}_${int_i}"
    echo "unsigned int ${int_sym} = ${int_file_i};" >> "$int_file"
    echo "extern unsigned int ${int_sym};" >> ints.h
    echo "${int_sym} +" >> int_sum.h
    int_i=$((int_i + 1))
  done
  int_file_i=$((int_file_i + 1))
done
echo '1;' >> int_sum.h

# Generate funcs.h and main.c.
rm -f funcs.h
cat <<EOF >main.c
#include "funcs.h"

int main(void) {
return
EOF
i=0
while [ "$i" -lt "$n_funcs" ]; do
  func_sym="f_${i}"
  echo "${func_sym}() +" >> main.c
  echo "int ${func_sym}(void);" >> funcs.h
  cat <<EOF >"${func_sym}.c"
#include "ints.h"

int ${func_sym}(void) {
#include "int_sum.h"
}
EOF
  i=$((i + 1))
done
cat <<EOF >>main.c
1;
}
EOF

# Generate *.o
ls | grep -E '\.c$' | parallel --halt now,fail=1 -t --will-cite "gcc $cflags -c -o '{.}.o' '{}'"

GitHub upstream .

При заданном вводе типа:

./generate-objects [n_int_file_is [n_ints_per_file [n_funcs]]]

Это генерирует основной, который делает:

return f_0() + f_1() + ... + f_(n_funcs)()

гдекаждая функция определена в отдельном f_n.c файле и добавляет n_int_file_is раз n_ints_per_file внешние целые числа:

int f_0() { return i_0_0 + i_0_1 + ... + i_(n_int_file_is)_(n_ints_per_file); }

Это приводит к:

n_int_file_is x n_ints_per_file x n_funcs

перемещениям по ссылке.

Затем я сравнил:

gcc -ggdb3 -O0 -std=c99 -Wall -Wextra -pedantic               -o main *.o
gcc -ggdb3 -O0 -std=c99 -Wall -Wextra -pedantic -fuse-ld=gold -o main *.o

для различных входных триплетов, что дало:

10000 10 10
nogold: wall=3.70s user=2.93s system=0.75s max_mem=556356kB
gold:   wall=1.43s user=1.15s system=0.28s max_mem=703060kB

1000 100 10
nogold: wall=1.23s user=1.07s system=0.16s max_mem=188152kB
gold:   wall=0.60s user=0.52s system=0.07s max_mem=279108kB

100 1000 10
nogold: wall=0.96s user=0.87s system=0.08s max_mem=149636kB
gold:   wall=0.53s user=0.47s system=0.05s max_mem=231596kB

10000 10 100
nogold: wall=11.63s user=10.31s system=1.25s max_mem=1411264kB
gold:   wall=6.31s user=5.77s system=0.53s max_mem=2146992kB

1000 100 100
nogold: wall=7.19s user=6.56s system=0.60s max_mem=1058432kB
gold:   wall=4.15s user=3.81s system=0.34s max_mem=1697796kB

100 1000 100
nogold: wall=6.15s user=5.58s system=0.57s max_mem=1031372kB
gold:   wall=4.06s user=3.76s system=0.29s max_mem=1652548kB

Некоторые ограничения, которые я пробовалдля смягчения:

  • в файлах 100k C, оба метода время от времени получают неудачные mallocs
  • GCC не может скомпилировать функцию с добавлением 1M

Протестировано в Ubuntu 18.10, GCC 8.2.0, ноутбук Lenovo ThinkPad P51, процессор Intel Core i7-7820HQ (4 ядра / 8 потоков), 2x оперативная память Samsung M471A2K43BB1-CRC (2x 16 ГБ), Samsung MZVLB512HAJQ-000L7 SSD (3000)МБ / с).

Я также наблюдал 2 раза в отладочной сборке gem5: https://gem5.googlesource.com/public/gem5/+/fafe4e80b76e93e3d0d05797904c19928587f5b5

3 голосов
/ 23 августа 2015

Некоторые проекты кажутся несовместимыми с золотом из-за несовместимых различий между лд и золотом.Пример: OpenFOAM, см. http://www.openfoam.org/mantisbt/view.php?id=685.

2 голосов
/ 25 ноября 2015

DragonFlyBSD переключился на золото в качестве компоновщика по умолчанию. Похоже, он готов к различным инструментам.
Больше деталей: http://phoronix.com/scan.php?page=news_item&px=DragonFlyBSD-Gold-Linker

...