Почему эта программа Go работает так медленно? - PullRequest
0 голосов
/ 14 октября 2019

Я только что прочитал несколько коротких руководств по Go и написал простую программу сита. Sieve использует алгоритм sieve для печати всех простых чисел, меньших 10000, что создает множество процедур go. Я получил правильные результаты, но программа работает очень медленно (5 секунд на моей машине). Я также написал сценарии lua и python, которые реализовали один и тот же алгоритм и работают намного быстрее (на моем компьютере они занимают около 1 секунды).

Обратите внимание, что цель состоит в том, чтобы получить представление о производительности рутины по сравнению ссопрограммы на других языках, например, луа. Реализация очень неэффективна, некоторые комментарии указали, что это неправильный способ реализации Sieve of Eratosthenes. Да, это намеренно. В некоторых других ответах указывалось, что медлительность вызвана печатным вводом / выводом. Поэтому я закомментировал печатные строки.

Мой вопрос: почему моя ситовая программа, реализованная на Go, такая медленная? Вот код:

package main

import (
  "fmt"
  "sync"
)


type Sieve struct {
  id int;
  msg_queue chan int;
  wg *sync.WaitGroup;
}


func NewSieve(id int) *Sieve {
  sieve := new(Sieve)
  sieve.id = id
  sieve.msg_queue = make(chan int)
  sieve.wg = new(sync.WaitGroup)
  sieve.wg.Add(1)
  return sieve
}


func (sieve *Sieve) run() {
  defer sieve.wg.Done()

  myprime := <-sieve.msg_queue
  if myprime == 0 {
    return
  }
  // fmt.Printf("Sieve (%d) is for prime number %d.\n", sieve.id, myprime)

  next_sieve := NewSieve(sieve.id + 1)
  go next_sieve.run()
  for {
    number := <-sieve.msg_queue
    if number == 0 {
      next_sieve.msg_queue <- number;
      next_sieve.wg.Wait()
      return
    } else if number % myprime != 0 {
      // fmt.Printf("id: %d, number: %d, myprime: %d, number mod myprime: %d\n", sieve.id, number, myprime, number % myprime)
      next_sieve.msg_queue <- number
    }
  }
}


func driver() {
  first := NewSieve(2)
  go first.run()
  for n := 2; n <= 10000; n++ {
    first.msg_queue <- n
  }
  first.msg_queue <- 0
  first.wg.Wait()
}


func main() {
  driver()
}

Для сравнения вот код sieve.lua

function sieve(id)
  local myprime = coroutine.yield()
  // print(string.format("Sieve (%d) is for prime number %d", id, myprime))

  local next_sieve = coroutine.create(sieve)
  coroutine.resume(next_sieve, id + 1)

  while true do
    local number = coroutine.yield()
    if number % myprime ~= 0 then
      // print(string.format("id: %d, number: %d, myprime: %d, number mod myprime: %d", id, number, myprime, number % myprime))
      coroutine.resume(next_sieve, number)
    end
  end
end


function driver()
  local first = coroutine.create(sieve)
  coroutine.resume(first, 2)
  local n
  for n = 2, 10000 do
    coroutine.resume(first, n)
  end
end

driver()

Ответы [ 2 ]

7 голосов
/ 14 октября 2019

Бессмысленные микробенчмарки дают бессмысленные результаты.

Вы синхронизируете распечатку ввода / вывода.

Вы выполняете рутинную работу и накладные расходы канала для небольшого объема работы.


Вот сито с простыми числами в Go.

Вывод:

$ go version
go version devel +46be01f4e0 Sun Oct 13 01:48:30 2019 +0000 linux/amd64
$ go build sumprimes.go && time ./sumprimes
5736396
29.96µs   
real    0m0.001s
user    0m0.001s
sys     0m0.000s

sumprimes.go:

package main

import (
    "fmt"
    "time"
)

const (
    prime    = 0x00
    notprime = 0xFF
)

func oddPrimes(n uint64) (sieve []uint8) {
    sieve = make([]uint8, (n+1)/2)
    sieve[0] = notprime
    p := uint64(3)
    for i := p * p; i <= n; i = p * p {
        for j := i; j <= n; j += 2 * p {
            sieve[j/2] = notprime
        }
        for p += 2; sieve[p/2] == notprime; p += 2 {
        }
    }
    return sieve
}

func sumPrimes(n uint64) uint64 {
    sum := uint64(0)
    if n >= 2 {
        sum += 2
    }
    for i, p := range oddPrimes(n) {
        if p == prime {
            sum += 2*uint64(i) + 1
        }
    }
    return sum
}

func main() {
    start := time.Now()

    var n uint64 = 10000
    sum := sumPrimes(n)
    fmt.Println(sum)

    fmt.Println(time.Since(start))
}
4 голосов
/ 14 октября 2019

Большую часть времени тратится на fmt.Printf.

Удаление строки:

fmt.Printf("id: %d, number: %d, myprime: %d, number mod myprime: %d\n", sieve.id, number, myprime, number%myprime)

сокращает время выполнения с ~ 5,4 секунды до ~ 0,64 секунды на одном из выполненных мной тестов.

Удаление ненужных sync.WaitGroup с сокращает время еще немного, до ~ 0,48 секунды. См. Версию без sync.WaitGroup здесь. Вы по-прежнему выполняете много операций с каналом, в которых языки с операторами yield-value-from-coroutine не нужны (хотя вместо этого у них есть свои проблемы). Это не очень хороший способ реализовать тест на простоту.

...