Я работаю над проектом машинного обучения, где мне нужно сгенерировать фрейм данных с текстом из различных файлов и тегами, связанными с каждым текстом (их может быть несколько). Сначала я создал два столбца: один из пустых строк для текста, а другой из пустых списков для списка тегов.
В качестве примера того, что происходит с проблемой, у меня есть общий список файлов trn_files и другой список alge_files , которые представляют собой файлы, которые нужно пометить как тип 'alge ». Я пытался сделать следующее:
trnset['data'] = ""
trnset['target'] = np.empty((len(trnset), 0)).tolist()
for file in trn_files:
trnset.loc[trnset['filenames'] == file,'data'] = read_text(f"{TRN}/{file}")
if file in alge_files:
trnset.loc[trnset['filenames'] == file, 'target'].append(pd.Series([CATEGORIES.index('alge')]))
У этого кода есть проблема: он ничего не добавляет к пустому списку, соответствующему каждой записи файла в кадре данных. Я могу напечатать серию панд для добавления, и я вижу результат, который я хочу добавить. Однако в список ничего не попадает.
Я что-то упускаю, например, inplace=True
? Кроме того, любые предложения по созданию столбцов пустых списков более чистым способом, чем я сделал для trnset['target']
?