CPU Environment : Intel (R) Xeon (R) Gold 6148 CPU @ 2,40 ГГц
Fisrt , Я устанавливаю тензор потока с pip install tensorflow==1.12.0
и загружаю тензор потока-эталон
Прогон 1: export MKL_VERBOSE=0;export MKL_ENABLE_INSTRUCTIONS=AVX512;python tf_cnn_benchmarks.py --device=cpu --data_format=NHWC --model=alexnet --batch_size=8
Прогон 2: export MKL_VERBOSE=0;export MKL_ENABLE_INSTRUCTIONS=AVX2;python tf_cnn_benchmarks.py --device=cpu --data_format=NHWC --model=alexnet --batch_size=8
Скорость почти такая же !!! Я также изменяю другую модель и размер партии.
Во-вторых, я также тестирую компиляцию caffe с помощью mkl. я нашел это
MKL_ENABLE_INSTRUCTIONS=AVX512
работает не так много, как MKL_ENABLE_INSTRUCTIONS=AVX2
.
Почему?