Использование данных Boston Maraton (для ясности я включил образец данных в файл csv). Напишите программу Python, в которой будут отбираться 50 гонщиков (в этом файле тысячи людей) по официальному времени с использованием случайной выборки и составлять гистограмму выборки. Ниже то, что у меня есть. Может кто-нибудь взглянуть, чтобы убедиться, что я сделал это правильно? Буду признателен за понимание этого. Спасибо !!
import numpy as np
import csv
def getBMData(filename):
data = []
csvfile= open(filename, 'rt', encoding='ISO-8859-1')
reader = csv.reader(csvfile, delimiter=',')
next(reader, None)
for row in reader:
if '-' in row[4]:
data.append(0.0)
else:
data.append(float(row[4]))
return data
def makeHist(data, bins, title, xLabel, yLabel):
plt.hist(data, bins)
plt.title(title)
plt.xlabel(xLabel)
plt.ylabel(yLabel)
def sampleTimes(times, numExamples):
sample = random.sample(times, numExamples)
makeHist(sample, 25, 'Sample Size: ' + str(numExamples), 'Minutes to complete race', 'Number of runners')
sampleSize= 50
sampleTimes(times, sampleSize)```