Когда я запускаю свой код, он работает для train_tags и печатает 0 TrainingData 1 TestingData Имя: категория, dtype: object
, но когда я запускаю тот же код для test_tags, он выдает мне эту серию ([], Имя: категория, dtype: object)
вот полный код:
path_train = r'C:\Users\Sgt.pookey01\Documents\Clickbait project\Article Titles'
files_train = skds.load_files(path_train,load_content=False)
files_train
{'filenames': array (['C:\ Users \ Sgt.pookey01 \ Documents \ Проект Clickbait \ Заголовки статей \ TrainingData \ TrainingData.txt ',' C: \ Users \ Sgt.pookey01 \ Documents \ Проект Clickbait \ Заголовки статей \ TestingData \ TestingData.txt '], dtype ='
label_index = files_train.target
label_names = files_train.target_names
labelled_files = files_train.filenames
data_tags = ["filename","category","Article Titles"]
data_list = []
i=0
for f in labelled_files:
data_list.append((f,label_names[label_index[i]],Path(f).read_text(encoding="utf-8")))
i += 1
data = pd.DataFrame.from_records(data_list, columns=data_tags)
train_size = int(len(data['Article Titles'][0])*.8)
train_posts = data['Article Titles'][:train_size]
train_tags = data['category'][:train_size]
train_files_names = data['filename'][:train_size]
train_tags
0 TrainingData 1 TestingData Имя: категория, dtype: object
test_posts = data['Article Titles'][train_size:]
test_tags = data['category'][train_size:]
test_files_names = data['filename'][train_size:]
test_tags
Серия ([], Имя: категория, dtype: объект)