Отбор проб из резервуара - PullRequest
       34

Отбор проб из резервуара

22 голосов
/ 10 апреля 2010

Чтобы извлечь k случайных чисел из массива неопределенного размера, мы используем технику, называемую выборкой из резервуара. Кто-нибудь может кратко осветить, как это происходит с примером кода?

Ответы [ 3 ]

31 голосов
/ 10 апреля 2010

Я на самом деле не понимал, что для этого есть имя, поэтому я доказал и реализовал это с нуля:

import random
def random_subset( iterator, K ):
    result = []
    N = 0

    for item in iterator:
        N += 1
        if len( result ) < K:
            result.append( item )
        else:
            s = int(random.random() * N)
            if s < K:
                result[ s ] = item

    return result

От: http://web.archive.org/web/20141026071430/http://propersubset.com:80/2010/04/choosing-random-elements.html

С доказательством в конце.

8 голосов
/ 01 марта 2017

Следуя более подробному описанию Кнута (1981), отбор проб коллектора (алгоритм R) может быть реализован следующим образом:

import random

def sample(iterable, n):
    """
    Returns @param n random items from @param iterable.
    """
    reservoir = []
    for t, item in enumerate(iterable):
        if t < n:
            reservoir.append(item)
        else:
            m = random.randint(0,t)
            if m < n:
                reservoir[m] = item
    return reservoir
1 голос
/ 01 февраля 2012

Java

import java.util.Random;

public static void reservoir(String filename,String[] list)
{
    File f = new File(filename);
    BufferedReader b = new BufferedReader(new FileReader(f));

    String l;
    int c = 0, r;
    Random g = new Random();

    while((l = b.readLine()) != null)
    {
      if (c < list.length)
          r = c++;
      else
          r = g.nextInt(++c);

      if (r < list.length)
          list[r] = l;

      b.close();}
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...