Как я понимаю из документации здесь , мне может потребоваться вызов типа tft.compute_and_apply_vocabulary(s)
для преобразования категориального столбца в числовую функцию.
Как новичок в тензорном потоке, яИнтересно, существует ли пользовательское сопоставление столбца необработанных объектов в числовой столбец? Я уже видел, что метод hash_bucket, описанный здесь , почти выполняет ту работу, которую я хочу. Но вместо хеша записей мне нужно вызвать пользовательскую функцию отображения , чтобы «m» уникальных элементов в категориальном столбце отображалось в «n» уникальных числовых или строковых элементов, где n
Вариант использования. Я столкнулся с этой проблемой во время эксперимента с набором данных KDD CUP 99, где целевой класс обучающего набора содержит 23 различных типа атак, где их необходимо идентифицировать иподразделяются на четыре класса атак. Если есть функция преобразования, я мог бы использовать ее так, чтобы все 23 уникальных элемента в целевом классе могли быть сопоставлены с 4 классами нумерации атак [1,2,3,4]. Включая обычное соединение, которое может быть сопоставлено с [0], целевой класс будет содержать 5 классов, и, таким образом, я могу напрямую обучать мультиклассовую модель классификации. Подробнее о наборе данных KDD CUP 99 здесь
Кто-нибудь может помочь?
ОБНОВЛЕНИЕ Решил этот вопрос с помощью этой темы