У меня проблема с агрегацией строк и преобразованием строк в tf.data.Dataset. Каждая строка имеет строку id
и строку category
, где некоторые категории являются подкатегориями других. Я хочу преобразовать набор данных, сопоставив каждое значение категории с кодировкой one hot
базовых категорий, а затем сгруппировав их по id
и суммировав кодировки one hot
. Я могу объединить несколько строк, используя tf.data.experimental.group_by_reducer
но я не могу на всю жизнь понять, как сопоставить их им с одним горячим кодированием, прежде чем уменьшать их.
Любая помощь будет оценена.
Пока я пытался использовать tf.one_hot
, но он не работает со строками. Я также пытался реализовать tf.lookup.StaticHashTable
, но не смог заставить его работать с тензорами в качестве значений, он жаловался на форму.
К сожалению, код был записан в блокноте и ушел сейчас ...
С уважением