входные данные для ранжирования тензорного потока в формате массива - PullRequest
0 голосов
/ 29 октября 2019

Пока все примеры, которые я могу найти для Tensorflow Ranking, используют только редкие функции, у меня уже есть набор данных, предварительно обработанный в массив numpy в следующем формате:

relevance, query, feature_1, feature_2, ... feature_100
   2,      "a",       0.1,         0.2, ...  0.15
   1,      "a",       0.2,        0.21, ...  0.15

Я смотрю на этопример, где он читает данные libsvm и возвращает словарь объектов, где каждый ключ является именем столбца объекта: https://github.com/tensorflow/ranking/blob/master/tensorflow_ranking/examples/tf_ranking_libsvm.py#L136 Но затем он выравнивается до размера [query_size * list_size, feature_count] перед подачей в график. https://github.com/tensorflow/ranking/blob/master/tensorflow_ranking/examples/tf_ranking_libsvm.py#L323

Нужно ли переформатировать мои данные, чтобы использовать ранжирование по тензорному потоку? Я вижу, example_feature_columns используется в encode_listwise_features и encode_pointwise_features, является ли создание example_feature_columns необходимостью для ранжирования tf?

...