Преобразование этикеток в быстрое кодирование - PullRequest
0 голосов
/ 06 мая 2020

Итак, я изучал горячее кодирование с использованием набора данных iris

iris = load_iris()
X = iris['data'] # the complete data -2D
Y = iris['target'] # 1-D only the 150 rows 
names = iris['target_names'] #['setosa','versicolor','viginica']
feature_names = iris['feature_names']# [sl,sw,pl,pw]
isamples = np.random.randint(len(Y), size = 5)
Ny = len(np.unique(Y))
Y = keras.utils.to_categorical(Y[:], num_classes = Ny)
print('X:', X[isamples,:])
print('Y:', Y[isamples])

Я запутался в этой части: Y = keras.utils.to_categorical(Y[:], num_classes = Ny)

что означает Y[:] и в чем польза из : в print(X[isamples,:])

1 Ответ

1 голос
/ 06 мая 2020

Набор данных ириса состоит из 150 образцов каждого из трех видов цветов ириса (Iris setosa, Iris Virginia и Iris versicolor). Для каждого образца были измерены четыре характеристики: длина и ширина чашелистиков и лепестков в сантиметрах. в вашем коде X представляет набор функций для обучения вашей модели, которые вы можете получить из iris.data, а y представляет собой целевую метку для каждой строки в наборе функций X, которые вы можете получить из iris.target. метки представлены с использованием числовых значений (например, 0 для класса setosa, 1 для класса Virginia и 2 для класса versicolor), вы можете получить имя каждого класса, используя iris.target_names. двоеточие, которое вы видите в скобках, называемое оператором среза в Python, которое позволяет вам брать подмножество элементов из элемента списка, например, если у вас есть список l = [1,2,3,4], если вы хотите просто второй и третий элементы списка вы можете просто использовать l [1: 3]. хорошо, теперь, используя оператор двоеточия без использования таких чисел, l [:] предоставит вам копию всего списка, поэтому Y [:] означает дать мне копию списка Y, а для print (X [isamples ,:]) isamples представляет собой список из 5 случайно сгенерированных индексов от 0 до 600, чтобы получить выборку характеристик из списка X print (X [isamples ,:]) означает взять 5 случайных выборок из списка функций и распечатать все четыре функции для каждой образец

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...