Простая C-программа для иллюстрации выполнения заказа? - PullRequest
0 голосов
/ 07 октября 2018

Я использую x86 и хочу практически увидеть ошибку, вызванную неправильным выполнением на моей машине.Я пытался написать одну, на основе этой статьи вики , но я всегда вижу, что «значение x равно 33»:

#include<stdio.h>
#include<pthread.h>
#include <sys/types.h>

int x, f;

void *handler(void *ptr) { 
  while (f == 0); 
  // Expectation: Sometimes, this should print 11 due to out-of-order exec
  printf("value of x is %d \n", x);
  return NULL;
}

int main() {
     pthread_t thread1;
     while(1) {
       x = 11; f = 0;
       pthread_create(&thread1, NULL, handler, NULL);
       x = 33; 
       f = 1;
       pthread_join(thread1, NULL);
     }   
     return 0;
}

Какая простейшая программа на c может иллюстрироватьошибка исполнения заказа?Почему иногда не выводится «значение x равно 11»?

1 Ответ

0 голосов
/ 07 октября 2018

Эффект, который вы пытаетесь создать, не зависит от порядка исполнения .Это только одна из вещей, которая может изменить порядок памяти.Кроме того, современный x86 выполняет неупорядоченное выполнение, но использует свой буфер порядка памяти, чтобы гарантировать, что хранилища фиксируют L1d / становятся глобально видимыми в программном порядке.(Поскольку модель памяти x86 допускает только переупорядочение StoreLoad, но не StoreStore.)

Переупорядочение памяти отделено от перестановки команд выполнение , потому что даже процессоры обычного порядка используют буфер хранилища, чтобы избежать остановкиcache-miss store.

Выполнение команды вне порядка: сохраняется ли порядок фиксации?

Является ли загрузка и сохранение единственной инструкцией, которая переупорядочивается?


Реализация AC на процессоре ARM в порядке могла бы печатать 11 или 33, если бы x и f оказались в разных строках кэша.


Я предполагаю, что вы скомпилировали с отключенной оптимизацией, поэтому ваш компилятор эффективно обрабатывает все ваши переменные volatile, то есть volatile int x,f.В противном случае цикл while(f==0); скомпилируется в if(f==0) { infloop; }, проверяя только f один раз.(Гонка данных UB для неатомарных переменных - это то, что позволяет компиляторам поднимать нагрузки из циклов, но volatile нагрузки должны выполняться всегда. https://electronics.stackexchange.com/questions/387181/mcu-programming-c-o2-optimization-breaks-while-loop#387478).

Запасы в результирующем асм / машинном коде будутпоявляются в исходном порядке C.

Вы компилируете для x86, который имеет сильную модель памяти: хранилища x86 - хранилища релизов, а нагрузки x86 - загрузочные нагрузки .получить последовательную согласованность, но вы получите acq_rel бесплатно. (И с неоптимизированным кодом это происходит, даже если вы не просите об этом.)

Таким образом, при компиляции без оптимизации для x86 ваша программаэквивалентно

_Atomic int x, f;

int main(){
    ...
    pthread_create
    atomic_store_explicit(&x, 33, memory_order_release);
    atomic_store_explicit(&f, 1, memory_order_release);
    ...
}

и аналогично для стороны загрузки. while(f==0){} - это нагрузочная загрузка на x86, поэтому сторона чтения ожидает, пока не увидит ненулевое значение f, что также гарантируетвидит x==33.

Но если вы скомпилировали для слабо упорядоченного ISA, такого как ARM или PowerPC, то порядок упорядочения памяти на уровне ассемблера позволяет переупорядочивать StoreStore и LoadLoad, так что это будет возможно для вашего pr.ogram для печати 11, если компилируется без оптимизации.

См. также https://preshing.com/20120930/weak-vs-strong-memory-models/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...