Агрегирование данных в tf.Dataset - PullRequest
0 голосов
/ 20 апреля 2020

У меня проблема с агрегацией строк и преобразованием строк в tf.data.Dataset. Каждая строка имеет строку id и строку category, где некоторые категории являются подкатегориями других. Я хочу преобразовать набор данных, сопоставив каждое значение категории с кодировкой one hot базовых категорий, а затем сгруппировав их по id и суммировав кодировки one hot

. Я могу объединить несколько строк, используя tf.data.experimental.group_by_reducer но я не могу на всю жизнь понять, как сопоставить их им с одним горячим кодированием, прежде чем уменьшать их.

Любая помощь будет оценена.

Пока я пытался использовать tf.one_hot, но он не работает со строками. Я также пытался реализовать tf.lookup.StaticHashTable, но не смог заставить его работать с тензорами в качестве значений, он жаловался на форму.

К сожалению, код был записан в блокноте и ушел сейчас ...

С уважением

...