Добавление элемента в список внутри ячейки данных - PullRequest
0 голосов
/ 15 сентября 2018

Я работаю над проектом машинного обучения, где мне нужно сгенерировать фрейм данных с текстом из различных файлов и тегами, связанными с каждым текстом (их может быть несколько). Сначала я создал два столбца: один из пустых строк для текста, а другой из пустых списков для списка тегов.

В качестве примера того, что происходит с проблемой, у меня есть общий список файлов trn_files и другой список alge_files , которые представляют собой файлы, которые нужно пометить как тип 'alge ». Я пытался сделать следующее:

trnset['data'] = ""
trnset['target'] = np.empty((len(trnset), 0)).tolist()

for file in trn_files:
    trnset.loc[trnset['filenames'] == file,'data'] = read_text(f"{TRN}/{file}")

    if file in alge_files:
        trnset.loc[trnset['filenames'] == file, 'target'].append(pd.Series([CATEGORIES.index('alge')]))

У этого кода есть проблема: он ничего не добавляет к пустому списку, соответствующему каждой записи файла в кадре данных. Я могу напечатать серию панд для добавления, и я вижу результат, который я хочу добавить. Однако в список ничего не попадает.

Я что-то упускаю, например, inplace=True? Кроме того, любые предложения по созданию столбцов пустых списков более чистым способом, чем я сделал для trnset['target']?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...