Итак, я изучаю ML и слышал об одном горячем кодировании.Я в порядке с концепцией, но у меня есть сомнения по поводу реализации ...
Скажем, у нас есть словарь 10000, и мы кодируем слова с ним.Использование одного горячего означает, что каждое слово является вектором, поэтому:
- первое слово: [1,0,0, ...]
- второе слово: [0,1,0, ...]
- и т. Д.
Мне кажется немного странным хранить каждое слово, используя 10000 бит ... Я бы использовал 11 бит для каждого слова, потому что 10000в двоичном виде - 111 0001 0000. Таким образом:
- первое слово: 000 0000 0001
- второе слово: 000 0000 0010
- третье слово: 000 0000 0011
(Или вы можете начать отсчет с 0: 000 0000 0000)
Это то, как реализовано одно горячее?