Как реализуется программа one-hot?Массив единиц и нулей или это просто число? - PullRequest
0 голосов
/ 06 февраля 2019

Итак, я изучаю ML и слышал об одном горячем кодировании.Я в порядке с концепцией, но у меня есть сомнения по поводу реализации ...

Скажем, у нас есть словарь 10000, и мы кодируем слова с ним.Использование одного горячего означает, что каждое слово является вектором, поэтому:

  • первое слово: [1,0,0, ...]
  • второе слово: [0,1,0, ...]
  • и т. Д.

Мне кажется немного странным хранить каждое слово, используя 10000 бит ... Я бы использовал 11 бит для каждого слова, потому что 10000в двоичном виде - 111 0001 0000. Таким образом:

  • первое слово: 000 0000 0001
  • второе слово: 000 0000 0010
  • третье слово: 000 0000 0011

(Или вы можете начать отсчет с 0: 000 0000 0000)

Это то, как реализовано одно горячее?

...