Чего мне не хватает, чтобы убедиться, что из файла CSV данных случайно отобраны только 50 человек? - PullRequest
0 голосов
/ 10 апреля 2020

Использование данных Boston Maraton (для ясности я включил образец данных в файл csv). Напишите программу Python, в которой будут отбираться 50 гонщиков (в этом файле тысячи людей) по официальному времени с использованием случайной выборки и составлять гистограмму выборки. Ниже то, что у меня есть. Может кто-нибудь взглянуть, чтобы убедиться, что я сделал это правильно? Буду признателен за понимание этого. Спасибо !!

Sample of the data from csv file

import numpy as np
import csv
def getBMData(filename):
    data = []
    csvfile= open(filename, 'rt', encoding='ISO-8859-1')
    reader = csv.reader(csvfile, delimiter=',')
    next(reader, None)
    for row in reader:
        if '-' in row[4]:
            data.append(0.0)
        else:
            data.append(float(row[4]))
    return data

def makeHist(data, bins, title, xLabel, yLabel):
    plt.hist(data, bins)
    plt.title(title)
    plt.xlabel(xLabel)
    plt.ylabel(yLabel)

def sampleTimes(times, numExamples):
    sample = random.sample(times, numExamples)
    makeHist(sample, 25, 'Sample Size: ' + str(numExamples), 'Minutes to complete race', 'Number of runners')
sampleSize= 50
sampleTimes(times, sampleSize)```




Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...