Разные результаты numpy.linalg.lstsq на разных процессорах - PullRequest
0 голосов
/ 29 апреля 2019

Меня довольно смущает поведение numpy.linalg.leastsq.Я сгенерировал абсолютно одинаковые входные данные, протравил их и переместил на две разные машины с разными операционными системами (Ubuntu 16.04 и Ubuntu 18.04), разными процессорами (AMD на Ubuntu 16.04 и Intel на Ubuntu 18.04) и с той же версией 1.16.3.

Моя матрица имеет бесконечное число условий, однако с компьютером Intel я могу найти хорошее решение проблемы (которое я знаю заранее, для теста), в то время как с компьютером AMD решение в значительной степени отличается.

Я полагаю, что это может быть вызвано различной реализацией двух архитектур OpenBLAS.Есть идеи, как заставить оба метода возвращать одно и то же значение?Это потому, что Intel использует оптимизированную реализацию MKL?

Мой процессор AMD является Threadripper со следующим cpuinfo :

vendor_id   : AuthenticAMD
cpu family  : 23
model       : 1
model name  : AMD Ryzen Threadripper 1950X 16-Core Processor
stepping    : 1
microcode   : 0x8001129
cpu MHz     : 2200.000
cache size  : 512 KB
physical id : 0
siblings    : 32
core id     : 15
cpu cores   : 16
apicid      : 31
initial apicid  : 31
fpu     : yes
fpu_exception   : yes
cpuid level : 13
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid amd_dcm aperfmperf eagerfpu pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 movbe popcnt aes xsave avx f16c rdrand lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw skinit wdt tce topoext perfctr_core perfctr_nb bpext perfctr_l2 mwaitx cpb hw_pstate ssbd vmmcall fsgsbase bmi1 avx2 smep bmi2 rdseed adx smap clflushopt sha_ni xsaveopt xsavec xgetbv1 clzero arat npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold avic
bugs        : fxsave_leak sysret_ss_attrs spectre_v1 spectre_v2 spec_store_bypass
bogomips    : 6786.57
TLB size    : 2560 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm hwpstate eff_freq_ro 

, в то время как у Intel есть следующее cpuinfo

vendor_id   : GenuineIntel
cpu family  : 6
model       : 26
model name  : Intel(R) Core(TM) i7 CPU         950  @ 3.07GHz
stepping    : 5
microcode   : 0x1d
cpu MHz     : 1668.950
cache size  : 8192 KB
physical id : 0
siblings    : 8
core id     : 3
cpu cores   : 4
apicid      : 7
initial apicid  : 7
fpu     : yes
fpu_exception   : yes
cpuid level : 11
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid dtherm ida flush_l1d
bugs        : cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf
bogomips    : 6147.49
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

Очевидно, что я бы предпочел работать на AMD, поскольку это гораздо более быстрый процессор.

...