Настройка мультииндекса для Dataframe - pandas / Jupyter - PullRequest
0 голосов
/ 18 июня 2020

Преобразовать список в словарь

    self.internal_output_df = pd.DataFrame(list)

Создать метки

    labels = [[str(i)] + [str(i) + '_' + str(x) for x in range(1, self.num_matches+1)]
              for i in range(1, len(self.df) + 1)]
    labels = [y for x in labels for y in x]
    self.internal_output_df['match'] = labels


    # Select final variables to display
    variables = [
        'a',
        'b',
        'c',
        'd',
        'e',
        'f',
        'g',
        'h'
    ]


    self.internal_output_df = self.internal_output_df.set_index('match')[variables]

"" "Пример формата данных" "" Формат, который я получаю: Output that I'm getting

Формат, который я хочу сгенерировать: Output that I want to generate

"" "ВОПРОС: Я получаю вывод ярлыка как:

Row1: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5'] 
Row2: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row3: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row4: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row5: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row6: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row7: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row8: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row9: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row10: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row11: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']
Row12: ['1', '1_1', '1_2', '1_3', '1_4', '1_5','2', '2_1', '2_2', '2_3', '2_4', '2_5']

Таким образом, значения фрейма данных повторяются для каждой строки в фрейме данных.

Я хочу получить уникальные значения вывода метки в виде одной строки для строк в фрейме данных в следующем формате:

Row1: 1
Row2: 1_1
Row3: 1_2
Row4: 1_3
Row5: 1_4
Row6: 1_5
Row7: 2
Row8: 2_1
Row9: 2_2
Row10: 2_3
Row11: 2_4
Row12: 2_5

Поэтому я не хочу, чтобы строки повторяли одни и те же значения в каждой строке. "" "

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...