Это часть открытого курса GIT, который я беру в свободное время для изучения Python.Упражнение имеет дело только с NumPy.Итак, ниже идет создание пути к файлу и импорт данных.Я добавил skip_header, потому что имена столбцов являются строками, и я получаю Nan.Итак, данные имеют 33 столбца, и мне нужно только 5, которые я добавил, используя usecols.
import numpy as np
fp = 'C:\\Users\\matij\\Documents\\exercise-5-MatijaKordic\\6153237444115dat.csv'
data = np.genfromtxt(fp, skip_header =1, usecols=(0, 2, 22, 27, 28), delimiter=',')
Далее мне нужно разделить данные на отдельные переменные, которые называются станция, дата, температура, температура_макс и температура_мин.Они соответствуют usecols = (0, 2, 22, 27, 28).
station = data[:, 0]
date = data[:, 1]
temp = data[:, 2]
temp_max = data[:, 3]
temp_min = data[:, 4]
После этого мне нужно вычислить следующее:
Какова средняя температура по Фаренгейту в данных?(временная переменная)
Каково стандартное отклонение максимальной температуры?(переменная temp_max)
Сколько уникальных станций существует в данных?(переменная станции)
Итак, я сделал это:
temp_mean = temp.mean()
temp_max_std = temp_max.std()
station_count = np.unique(station)
И я получил NaN для среднего и макс.Для уникальных станций я получаю [28450.29980.] поэтому я полагаю, мне нужно как-то добавить счет в?
Что касается среднего и максимального: - Макс это Нэн, так что все в порядке.Не уверен, почему у меня это в назначении, но это другая история.- Имею ввиду, однако, причина этого вопроса.Когда я печатаю temp, я получаю значения, так почему я получаю NaN для temp.mean?
Вот ссылка на csv, если кому-то интересно: https://drive.google.com/file/d/1rGneQTfUe2rq1HAPQ06rvLDxzi-ETgKe/view?usp=sharing