преобразовать необработанные категориальные функции, используя пользовательскую функцию отображения - PullRequest
0 голосов
/ 07 ноября 2019

Как я понимаю из документации здесь , мне может потребоваться вызов типа tft.compute_and_apply_vocabulary(s) для преобразования категориального столбца в числовую функцию.

Как новичок в тензорном потоке, яИнтересно, существует ли пользовательское сопоставление столбца необработанных объектов в числовой столбец? Я уже видел, что метод hash_bucket, описанный здесь , почти выполняет ту работу, которую я хочу. Но вместо хеша записей мне нужно вызвать пользовательскую функцию отображения , чтобы «m» уникальных элементов в категориальном столбце отображалось в «n» уникальных числовых или строковых элементов, где n

Вариант использования. Я столкнулся с этой проблемой во время эксперимента с набором данных KDD CUP 99, где целевой класс обучающего набора содержит 23 различных типа атак, где их необходимо идентифицировать иподразделяются на четыре класса атак. Если есть функция преобразования, я мог бы использовать ее так, чтобы все 23 уникальных элемента в целевом классе могли быть сопоставлены с 4 классами нумерации атак [1,2,3,4]. Включая обычное соединение, которое может быть сопоставлено с [0], целевой класс будет содержать 5 классов, и, таким образом, я могу напрямую обучать мультиклассовую модель классификации. Подробнее о наборе данных KDD CUP 99 здесь

Кто-нибудь может помочь?

ОБНОВЛЕНИЕ Решил этот вопрос с помощью этой темы

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...