Преобразуйте это значение веса / результата из входного файла .csv в список имен столбцов, отсортировав их по убыванию в формате матрицы весов / показателей с использованием Python Apache Beam
и записав в другой . CSV файл
Input .csv file
user_id, cat_1, cat_2, cat_3, cat_4, cat_5, cat_6
1 , 0.10, 0.2, 0.20, 0.12, 0.7, 0.6
2 , 0.6, 0.20, 0.12, 0.15, 0.13, 0.11
3 , 0.11, 0.10, 0.8, 0.12, 0.3, 0.7
Desired output .csv file
user_id, top_3_categories
1, [('cat_3', '0.20'), ('cat_2', '0.2'), ('cat_1', '0.10')]
2, [('cat_1', '0.6'), ('cat_2', '0.20'), ('cat_3', '0.12')]
3, [('cat_3', '0.8'), ('cat_1', '0.11'), ('cat_2', '0.10')]