Как управлять слишком большим количеством классов в глубоком обучении? - PullRequest
0 голосов
/ 11 февраля 2020

Я работаю над проектом распознавания лиц, и у меня есть набор данных с именем Multi-p ie. Этот набор данных содержит 317 предметов. Итак, у меня есть 317 класс для моего модального. Я работал для предварительной обработки набора данных. Но я не могу добиться успеха, как реализовать лейбл. Я создал CSV-файл, содержащий имена файлов и subjectNo.

  labels = dataset[:,1:]
  filenames = dataset[:,0:1]
  print(filenames[0])
  print(labels[0])

  filenames_shuffled, y_labels_one_hot_shuffled = shuffle(filenames, labels)

  X_train_filenames, X_val_filenames, y_train, y_val = train_test_split(
  filenames_shuffled, y_labels_one_hot_shuffled, test_size=0.2, random_state=1)

  print(X_train_filenames.shape) 
  print(y_train.shape)           

  print(X_val_filenames.shape)   
  print(y_val.shape)

Вывод этого кода здесь:

  (60288, 1)
  (60288, 1)
  (15072, 1)
  (15072, 1)

Но я думаю, что вывод будет выглядеть так:

  (60288, )
  (60288, 317)
  (15072, )
  (15072, 317)

Что я делаю? Я прикрепил изображение ниже показывает CSV-файл.

csv file

...