Пока все примеры, которые я могу найти для Tensorflow Ranking, используют только редкие функции, у меня уже есть набор данных, предварительно обработанный в массив numpy в следующем формате:
relevance, query, feature_1, feature_2, ... feature_100
2, "a", 0.1, 0.2, ... 0.15
1, "a", 0.2, 0.21, ... 0.15
Я смотрю на этопример, где он читает данные libsvm и возвращает словарь объектов, где каждый ключ является именем столбца объекта: https://github.com/tensorflow/ranking/blob/master/tensorflow_ranking/examples/tf_ranking_libsvm.py#L136 Но затем он выравнивается до размера [query_size * list_size, feature_count]
перед подачей в график. https://github.com/tensorflow/ranking/blob/master/tensorflow_ranking/examples/tf_ranking_libsvm.py#L323
Нужно ли переформатировать мои данные, чтобы использовать ранжирование по тензорному потоку? Я вижу, example_feature_columns
используется в encode_listwise_features
и encode_pointwise_features
, является ли создание example_feature_columns
необходимостью для ранжирования tf?