Скорость обещанных веб-работников - PullRequest
1 голос
/ 22 июня 2019

Мне нужно вычислить математически интенсивную функцию много раз (> 10000). Я думал, что буду использовать веб-работников, чтобы сократить время вычислений.

Я использую функцию, которая создает большой двоичный объект функции, оборачивает ее выполнение в обещание и запускает веб-работника в большом двоичном объекте. Я протестировал его, и он работает, но работает значительно медленнее, чем однопоточный подход.

SingleThreaded: 3 миллисекунды Многопоточный: 5524 миллисекунды

Полный код, включая тест по времени:

https://codepen.io/zakerytclarke/pen/BgRyBm?editors=0012

Этот код вычисляет первые n квадратов и помещает их в массив. Консоль показывает соответствующее время для запуска однопоточного и многопоточного.

Это функция, которую я использую для обещания веб-работникам. Что-то не так с этим, что заставляет время выполнения быть намного больше, чем простой цикл for?

function thread(fn){
  return function(args){
    return new Promise(function(resolve) {

        var worker=new Worker(URL.createObjectURL(new Blob(['('+fn+')('+JSON.stringify(args)+')'])));
        worker.postMessage(args)
        worker.onmessage = function(event){
            resolve(event.data);
            worker.terminate();
        };
    });
  }
 }

Спасибо за вашу помощь.

Вот информация о моем процессоре в случае, если это имеет значение:

uinfo 
processor   : 0
vendor_id   : GenuineIntel
cpu family  : 6
model       : 76
model name  : Intel(R) Atom(TM) x7-Z8700  CPU @ 1.60GHz
stepping    : 3
microcode   : 0x367
cpu MHz     : 901.401
cache size  : 1024 KB
physical id : 0
siblings    : 4
core id     : 0
cpu cores   : 4
apicid      : 0
initial apicid  : 0
fpu     : yes
fpu_exception   : yes
cpuid level : 11
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology tsc_reliable nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 movbe popcnt tsc_deadline_timer aes rdrand lahf_lm 3dnowprefetch epb pti ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid tsc_adjust smep erms dtherm ida arat
bugs        : cpu_meltdown spectre_v1 spectre_v2
bogomips    : 3200.00
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor  : 1
vendor_id   : GenuineIntel
cpu family  : 6
model       : 76
model name  : Intel(R) Atom(TM) x7-Z8700  CPU @ 1.60GHz
stepping    : 3
microcode   : 0x367
cpu MHz     : 875.272
cache size  : 1024 KB
physical id : 0
siblings    : 4
core id     : 1
cpu cores   : 4
apicid      : 2
initial apicid  : 2
fpu     : yes
fpu_exception   : yes
cpuid level : 11
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology tsc_reliable nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 movbe popcnt tsc_deadline_timer aes rdrand lahf_lm 3dnowprefetch epb pti ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid tsc_adjust smep erms dtherm ida arat
bugs        : cpu_meltdown spectre_v1 spectre_v2
bogomips    : 3200.00
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

 processor : 2
vendor_id   : GenuineIntel
cpu family  : 6
model       : 76
model name  : Intel(R) Atom(TM) x7-Z8700  CPU @ 1.60GHz
stepping    : 3
microcode   : 0x367
cpu MHz     : 860.525
cache size  : 1024 KB
physical id : 0
siblings    : 4
core id     : 2
cpu cores   : 4
apicid      : 4
initial apicid  : 4
fpu     : yes
fpu_exception   : yes
cpuid level : 11
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology tsc_reliable nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 movbe popcnt tsc_deadline_timer aes rdrand lahf_lm 3dnowprefetch epb pti ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid tsc_adjust smep erms dtherm ida arat
bugs        : cpu_meltdown spectre_v1 spectre_v2
bogomips    : 3200.00
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:

processor  : 3
vendor_id   : GenuineIntel
cpu family  : 6
model       : 76
model name  : Intel(R) Atom(TM) x7-Z8700  CPU @ 1.60GHz
stepping    : 3
microcode   : 0x367
cpu MHz     : 557.593
cache size  : 1024 KB
physical id : 0
siblings    : 4
core id     : 3
cpu cores   : 4
apicid      : 6
initial apicid  : 6
fpu     : yes
fpu_exception   : yes
cpuid level : 11
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology tsc_reliable nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 movbe popcnt tsc_deadline_timer aes rdrand lahf_lm 3dnowprefetch epb pti ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid tsc_adjust smep erms dtherm ida arat
bugs        : cpu_meltdown spectre_v1 spectre_v2
bogomips    : 3200.00
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management:```

1 Ответ

1 голос
/ 23 июня 2019

Вы игнорируете серьезные накладные расходы веб-работников. Неудивительно, что ваш код, который создает блоб путем строковой функции, создает работника из этого файла, анализирует код работника, создает экземпляр обещания, отправляет сообщение, устанавливает прослушиватель и асинхронно ожидает результата от работника, в несколько тысяч раз медленнее, чем однократное умножение двух двойных. На самом деле, я очень удивлен, что вам даже удается вызвать 10000 рабочих всего за 5 секунд.

Этот тест оценивает настройку работника в 40 мс. Так что нет, рабочие не легкие темы, которые вы должны порождать для чего-либо. Они подразумеваются как рабочие потоки , и вам следует отправлять (много) сообщений на них для обработки и получения ответов. Возможно, вы захотите создать рабочий пул для распределения нагрузки по нескольким потокам.

Конечно, для вашей функции square это не относится. Это слишком мало - он делает только одно умножение. Выполнение этого в главном потоке будет быстрее, чем все, что связано с другим потоком. Если в этой функции у вас был цикл из 100000 элементов, он мог бы стоить запустить его в фоновом потоке. Достигнутая вами однопоточная производительность 3 мс даже не заметно блокирует основной поток.

...